Võimatu missioon – veebilehe külastusstatistika mõõtmine
27.02.2007 | Lembit
Veebilehtede külastatavuse täpne mõõtmine on võimatu. Veebiserveri logifaile analüüsival tarkvaral (nagu Webalizer) on omad puudused, JavaScript’i ja küpsiseid (cookies) kasutaval tarkvaral (nagu Google Analytics) omad. Need puudused on olnud ammu teada ja turundajad on õppinud nendega arvestama, niivõrd-kuivõrd. Viimase paari aasta arengud on aga külastusstatistika analüüsimise senised viisid hoopis kahtluse alla seadnud. Veebis kasutatava tehnoloogia areng (AJAX, Flash, RSS, Atom jne) ja veebi kui meediumi areng (sisu segunemine ja “laenamine”, sotsiaalvõrgustikud) muudavad vastavaid lahendusi kasutava lehe juures mõttetuks senise tähtsaima mõõdiku – lehekülje vaatamise (pageview). Ka külastus (visit) on küllaltki umbmäärane mõõdik.
Ma tõesti tahtsin hakata külastusstatistika teemadel targutama. Plaanis oli püüda anda näpunäited, et mida ja kuidas ikkagi silmas pidada ses külastatavuse mõõtmise tohuvabohus. See kanne ootas mustandina pea 4 kuud ja nüüd näen, et parim, mida oskan pakkuda, on vaid valik viiteid teemast huvitatutele. Nuputame koos.
Alustaks eluterve lähenemisega Performancing’i ex-pealikult Chris Garrett’ilt – Obsessing Over Numbers. Chris leiab, et ükskõik kui laiahaardelise tarkvarapaketiga kogutud numbrid ei tähenda iseenesest suurt midagi ja neid ei tasu kõrvutada konkurendi omadega. Petlik statistika on eelkõige vahend oma lehe arengu mõõtmiseks. “Just like at the gym, it is your own performance you need to be concerned with, not the guy on the next rack who looks like Arnie.”
Telefoniraamatus on rohkem lehekülgi kui “Kevades”
Blogger’i loojaid Evan Williams arutleb pageview‘de iganemise üle. Mida siis tänapäeval jälgida? “It depends,” on Evan’i vastus. Tõepoolest, enamike “tavaliste” heade keskmiste veebilehtede jaoks (rõhuv enamik Eesti veebis) on ju pageview täiesti toimiv ja kasutatav ka edaspidi. Suurematest keskkondadest kirjutav Evan aga leiab, et küllap on külastaja poolt lehel veedetud aeg üks väga tähtis kriteerium, mille järgi keskkonna edukust mõõta. Evan’i jutu ühe läbiva mõttega – suur pageview‘de arv viitab vägisi keskkonna halvale disainile, ülesehitusele (à la MySpace) – haakub Yahoo! peavisionääri (Chief of Insights) Peter Daboll’i arvamus Time for a new hit (via Peeter Marvet).
Kirjutasin juhtlõigus, et statistikatarkvara puudused on olnud ammu teada – Briti internetiturundusfirma RedEye tegi juba 2003. aasta lõpus huvitava võrdleva uuringu IP-põhise ja cookie-põhise statistika kohta. Tulemus: IP-põhine statistika ülehindab külastatavust kuni 7 ja küpsisestatistika kuni 2 korda. “The report concludes that Cookie-based tracking, combined with appropriate weightings, is the only way to ensure data that is accurate enough to base strategic decisions upon.”
Eelviidatud kriitikast hoolimata, peab ometi püüdma iga veebilehe külastatavust mõõta nii hästi kui vähegi võimalik. See Digital Web Magazine’i artikkel annab nõu, mida jälgida CMS-i valikul, programmeerimisel ja lehe loomisel üldiselt, et statistika kogumist tõhustada.
Määratlematu AJAX ja runaway Flash
Mullu septembris Adobe’i poolt ostetud Rumeenia tarkvarafirma InterAKT tegeles muuhulgas ka AJAX-i toolkit‘i loomisega Dreamweaver’i jaoks. Sealsest beetatestijate foorumist ka see jutulõim, kus arutleti AJAX-it kasutavate veebide träkkimise üle. AJAX-iga on keerulised lood, sest alustama peab küsimusest – mida üldse träkkida? Kui meil on mingi tabbed paneelidega lahendus, kas pidada iga paneeli eraldi leheküljeks?
Google Analytics’i südameks olevat urchinTracker‘it saab õnneks kasutada ka AJAX’it kasutavatel lehtedel toimuva mõõtmiseks ja sealjuures paindlikult, arendaja soovi järgi – How do I track AJAX applications? Samuti õnnestub hõlpsasti Flash’i klikkide või failide allalaadimise track‘imine.
Flash’iga on see jama (heas mõttes), et kui sa saad hakkama mõne viral tükiga – näiteks popi Flash-mänguga, aga miks mitte ka edeva bänneriga – siis kipuvad kasutajad seda maha salvestama ja oma lehtede kaudu levitama. Sel puhul võib abi olla MochiBot‘ist, mis peaks suutma träkkida sinu Flash’i kõikjal internetist. Tasuta. (Kõrvalepõige: raha tahab Mochi Media teenida innovatiivse MochiAds-reklaamvõrguga, miskaudu saavad arendajad müüa reklaami oma Flash-mängudesse. MochiAds’i ülevaade TechCrunch’is.)
RSS-voogude statistika praegu suurim väljakutse
Omaette murelaps statistika osas on muidugi RSS. Või, tähendab, uudisvood laiemalt, on need siis RSS- või Atom-formaadis. FeedBurner on levinuim lahendus, millega sügavamale oma voogudega toimuvasse piiluda. Et kui palju ja millega vooge loetakse. Viisime meiegi, Peeter Marveti eeskujul, oma blogi postituste feed‘i hiljuti FeedBurner’isse üle ja otsime samamoodi lahendust ühilduvusprobleemidele ühe oma peamise liiklusmagneti Blogtree‘ga. Lahenduskäik Blogtree ja FeedBurner’i+WordPress’i lepitamiseks on meil isegi vist olemas ja kui see ka toimib, sel teemal postitus soolas. WordPress’i voogude FB-sse “kõrvetamise” teeb hõlpsaks Steve Smith’i FeedBurner Plugin. (Kõrvalepõige: kuna mul pole ilmselt aega, aga mis peamine, pädevust RSS-i kui tehnoloogia kitsaskohtadest ja Atom’i väidetavast paremusest kirjutada, siis suran siiasamma 2 huvitavat linki soome keele tönkajatele – RSS:n ongelmat, top-5, Miksi RSS ei kelpaa.)
Kuna ma vahendan siin niigi vanu (aga loodetavasti ajatuid :)) viiteid, siis – RSS-i statistika mõõtmise osas tegi olulise ja tänuväärse sammu Google, kui pani oma blogirobot Feedfetcher’i raporteerima voogude lugejaarvu (Google Reader + Google Personalized Homepage). Google’i enda blogipostitus, rohkete viidetega kajastas Lorelle VanFossen, Eestis kajastasid Pets ja No. 6.
Google Analytics’i sarnane, JS-i ja küpsiseid kasutav statistikamootor Mint tõotab pakkuda andmeid ka RSS-i tellimise ja lugemise kohta. Lahendus, mille taga sIFR-i autoreid Shaun Inman, mõjub feature list‘i ja ekraanipauke vaadates värske ja paljutõotavana. Hind, 30$ lehe kohta, kutsub ka proovima…
Üks mõõt kõigile
Google Analytics on tegelikult godsend. Kui vaadata Interactive Advertising Bureau (IAB) hõlma all küpsenud põhjalikke standardeid ja juhtnööre reklaamide efektiivsuse mõõtmiseks, siis tuleb vägisi pähe mõte, et veebilehtede statistika osas ei saa mingit keskset standardiloomet sündida, sest – (suurte) veebikeskkondade push‘imisest hoolimata –, selle vastu räägib mitme teise sektori ärihuvi. Igasugu kallist statistikatarkvara tootvate firmade huvides on pigem püüda kala sogases vees. Samas sogases vees saavad tähtsa konsultandimaski ette tõmmata igatsorti benderid ja diletandid, ka mina.
Õnneks tuli Google ja pani Urchin’i kõigile tasuta püsti – sest Google’i eesmärk on müüa veel rohkem (teksti)reklaame ja selle nimel on nad nõus oma kulul varustama kogu maailma veebid mitte lihtsalt mõõtmise standardiga, vaid ühtse ja toimiva mõõtmise lahendusega. Järsku ongi nii, et mis selle statistika mõõtmise üle enam ikka nii väga teoretiseerida ja arutleda – peatselt on ju kogu Veeb kenasti mõõdetav ühtses GA taustsüsteemis.

28.02.2007 kell 11:20
Feedburner+Wordpress jaoks on olemas plugin http://orderedlist.com/wordpress-plugins/feedburner-plugin/ mis sinu senise sööte lugejad kenasti redirectib ning samas Feedburneri enda kliendi söötele ligi laseb (selle soovituse võiks kohe su põhiteksti sisse panna).
28.02.2007 kell 12:07
Väike täpsustus. Pageview-de arv üksi ei näita suurt midagi. GA-s on näiteks palju parem näitaja olemas - pageviews per visit. See saadakse siis pageview-de arvu jagamisel külastuste arvuga. Minu meelest on see väga hea mõõdik, mida jälgida.
28.02.2007 kell 14:57
Peeter, just seda pluginat me kasutamegi, aga Blogtree suhtes mured samad, mis sinu FB-jutus. URL-i pidime paluma käsitsi muuta, et Blogtree uued kanded üles korjaks. Aga kataloogi enam kanded ei jõua. Üldises (kõik blogid) otsingus oleme sees, aga kui kasutada nende freimis olevat valikut “Otsi sellest blogist”, siis jälle mitte. Eks põhjus vist ikka see, et kasutavad blogi aadressi vastavates URL-ides.
Samad sümptomid ilmnevad ka sinu blogiga.
Aga aitäh soovituse eest, selle väärt plugina peaks tekstis ära mainima küll, saab valutult juba tellijaid eviva blogi FB-sse üle kolida.
Blogtree mure mõtlesime lahendada nii, et kirjutame sinna pluginasse juurde rule‘i, mis laseb ka nende Harvester’i WP default feed‘i URL-ile ligi ja palume peale seda Blogtree kuttidel meie voo URL-i jälle tagasi muuta.
28.02.2007 kell 21:41
Märkus FeedBurner’i kohta — FB on kohati ikka paras pidur. Pole süstemaatiliselt uurinud, aga aeg-ajalt torkab silma, et postitused jõuavad FB-voo kaudu kohale märkimisväärse hilinemisega, isegi 30 min ja ehk enamgi. Kuna meie kommentaaride voog on (veel) “kõrvetamata”, on muutunud tavaliseks olukord, kus postituse kommentaarid saabuvad RSS-lugejasse varem kui postitus ise.
01.03.2007 kell 09:04
blog.tr.ee on nüüd opensource nagu ma aru saan, misläbi igaüks meist (kes oskab) võib sinna redirectist arusaamise sisse ehitada (on ikka mage http päring neil küll mis redirecti ei tunnista). Põhimõtteliselt lahendaks see ka teise probleemi st otsingu.
06.04.2007 kell 00:45
Märkus tuleviku tarvis: Feedburner’i logist näeb, et Blogtree robot identifitseerib end u. nii:
bteHarvester/1.5 (+http://blog.tr.ee/harvester.htm)
Hea teada, kui nüüd ikkagi proovida seda va FB-redirect’i pluginat ümber teha, Blogtree-sõbralikumaks.
07.05.2007 kell 01:52
Steve Smith’i FeedBurner Plugin on nüüd ja edaspidi loogilisel moel Feedburneri hallata ja arendada, uueks nimeks FeedSmith.
10.10.2007 kell 17:33
[...] Aga tagasi postituse algusesse - kvaliteetset lugemist teemal “erinevate programmide statistika sama saidi kohta” leiab koos asjalike selgituste ning põhjendustega StoneTemple lehelt: 2007 Web Analytics Shootout - Final Report. (Allikale viitas ka Pets via metrix.ee ajaveeb via Meelise vihje ). Samuti tasuks visata pilk peale pooleaasta vanusele DT blogi postitusele seoses külastusstatistika mõõtmisega. [...]