Spämm rikub veebilehtede statistika
27.03.2007 | GunnarPeale muude ebamugavate nähtuste, mis spämmiga kaasnevad, panevad spämmerid põntsu ka eelkõige väiksemate veebide külastuste statistikale. Suurema külastatavusega lehti antud probleem nii teravalt ei puuduta, sest tavaliste külastajate poolt tekib juba piisavalt palju liiklust, et spämmirobotite oma sellest tühise osa moodustaks.
Webalizer – esimene ohver
Webalizer genereerib külastuste statistika serveri logide põhjal. Spämmirobotid liiguvad blogis, küsides lehekülgi ning liikudes lingilt lingile. Igast pöördumisest jääb jälg maha ka serveri logisse. Webalizer pole enamasti mitte millegi põhjal võimeline tuvastama, kas antud pöördumised tekitas inimene või robot, sest robotit pole raske programmeerida selliselt, et ta mängib serveri jaoks mõnda tuntud brauserit.
Tulemuseks on see, et lehe külastuste arv on näiliselt tõusnud ning kui miski ei viita spämmeri pidevatele külastustele, võib lehe omanikul jääda mulje, et saidi sisu on väga hea ja kasulik, sest külastuste arv on jõudsalt kasvanud. Tegelikkuses aga tekitab uusi külastusi juurde automaatika, mis ei jaga sisust tuhkagi, vaid otsib eelkõige vorme, mida automaatselt täita.
Google Analytics – teine ohver
Ohvriks võib sattuda ka Google Analytics, mis saab külastuste info kätte JavaScript’i abil. Piisab vaid sellest, et robot on kirjutatud Internet Explorer’i komponente kasutades. IE komponendid on võimsad vahendid oma brauserite ja veebiagentide kirjutamiseks, käe-jala ulatuses on kogu IE funktsionaalsus. Nende hulgas ka JavaScript, mis on vajalik, et brauser saaks saata info pöördumise kohta Google Analytics’i serverile. See loob olukorra, kus robotit on pea võimatu eristada tavalisest külastajast.
Statistika moondub
Sellises olukorras moondub väiksema veebilehe külastuste statistika oluliselt. Külastuste statistikaga tegelevad vahendid ei suuda eristada inimeste ja robotite külastusi ning panevad need ühte patta kokku. Lehe omanik näeb seda kõike selliselt, et külastuste arv on märgatavalt tõusnud.
Kuidas tuvastada spämmerite külaskäike
Kui spämmirobotil on võimalus oma teateid kuhugi salvestada, siis jääb tema külastusest märk maha ning sel teel on võimalik tuvastada, kas on rämpsuroboteid külas käinud või ei. Samuti tasub vaadata brauserite statistikat näiteks Webalizer’ist. Ka sel teel on osaliselt võimalik tuvastada spämmiroboteid.

27.03.2007 kell 11:34
Selle kõige vastu oleks lihtne lõkse üles seada. Näiteks saab panna lehele mõni inimesele varjatud link või hoiatustekstiga vorm, mille külastamisel antud IP’ga päringuid ei arvestataks.
27.03.2007 kell 12:53
Selle saaks korda ajada ka peidetud linkidega. Inimene neid vaevalt taga otsib ja robot, mis analüüsib lehe mark-up’i lendab jällegi selle lingi peale. ISP-de seiskohalt tekib aga üks tüütu küsimus - kuidas teha nii, et antud IP automaatselt webalizeri konfi kirja läheb. See oleks ehk idee näiteks Data Zone’i meeskonnale, mille kallal natukese pead murda.