Bot traffic tarkoittaa verkkosivuston liikennettä, jonka tuottavat automaattiset ohjelmat (botit) ihmisten sijaan. Osa tästä liikenteestä on hyödyllistä (kuten hakukoneiden indeksointirobotit), mutta osa voi olla haitallista tai vääristää analytiikkadataa.
Hyvä ja huono bot-liikenne
Hyödyllinen bot-liikenne
Osa boteista on välttämätön verkon toiminnalle:
- Hakukoneiden crawlerit (Googlebot, Bingbot) – Indeksoivat sivuston sisällön hakukoneisiin
- Sosiaalisen median botit (Facebookin, LinkedInin crawlerit) – Hakevat esikatselukuvat ja -tekstit linkitettäessä
- Seurantapalvelut (Pingdom, UptimeRobot) – Valvovat, onko sivusto verkossa
- SEO-työkalujen crawlerit (Ahrefs, SEMrush) – Keräävät tietoa backlinkeistä ja sijoituksista
Nämä botit noudattavat yleensä robots.txt-tiedostoa ja ilmoittavat itsensä User-Agent -tunnisteen kautta.
Haitallinen bot-liikenne
Osa boteista voi aiheuttaa ongelmia:
- Scraper-botit – Kopioivat sivuston sisällön kilpailijalle tai datan kauppaamiseen
- Spam-botit – Jättävät roskaviestejä lomakkeisiin ja kommenttikenttiin
- Click fraud -botit – Klikkaavat maksettuja mainoksia kuluttaakseen budjettia
- DDoS-botit – Yrittävät kaataa sivuston lähettämällä tuhansia pyyntöjä sekunnissa
- Credential stuffing -botit – Yrittävät murtautua sisään varastettujen salasanojen avulla
Tämäntyyppinen liikenne voi kuormittaa palvelinta, vääristää analytiikkaraportteja ja vaarantaa tietoturvan.
Kuinka bot-liikenne vaikuttaa analytiikkaan
Jos bot-liikennettä ei suodata, se vääristää Google Analyticsin raportteja:
- Pomppuprosentti nousee – Botit eivät selaa sivustoa, vaan poistuvat heti
- Istunnon kesto laskee – Botit viettävät sivustolla 0 sekuntia
- Konversiot laskevat suhteessa liikenteeseen – Botit eivät osta tai täytä lomakkeita
- Maantieteelliset raportit vääristyvät – Botit voivat tulla maista, joissa todellisia asiakkaita ei ole
Tämä vaikeuttaa päätöksentekoa: et tiedä, onko kampanjasi todella tehoton vai ovatko numerot vääristyneet bottien takia.
Kuinka tunnistaa ja estää bot-liikennettä
1. Google Analyticsin bot-suodatus Google Analyticsin asetuksista voi aktivoida “Exclude all hits from known bots and spiders” -vaihtoehdon. Tämä suodattaa suurimman osan tunnetusta bot-liikenteestä automaattisesti.
2. Tarkastele User-Agent -tietoja Palvelimen lokitiedostoista tai analytiikkatyökaluista voi tarkistaa, mitkä User-Agent -tunnisteet tuottavat liikennettä. Epäilyttävät tai tuntemattomat tunnisteet voi estää palomuurissa.
3. Cloudflare tai vastaava suojaus CDN-palvelut kuten Cloudflare tai Sucuri tarjoavat automaattisen bot-suojauksen. Ne haastavat epäilyttävät kävijät (esim. CAPTCHA-testillä) ennen sivustolle pääsyä.
4. Rate limiting Rajoita, kuinka monta pyyntöä yksi IP-osoite voi tehdä minuutissa. Jos sama IP yrittää avata 100 sivua 10 sekunnissa, se on selvästi botti.
5. Honeypot-kentät lomakkeissa Lisää lomakkeisiin piilotettu kenttä, jota ihmiset eivät näe mutta botit täyttävät. Jos kenttä täyttyy, lomake hylätään.
6. Tarkkaile liikennepiikkejä Jos analytiikassa näkyy äkillinen, epäluonnollinen liikennepiikki (esim. 10 000 käyntiä tunnissa), kyseessä on todennäköisesti bot-hyökkäys. Tarkista, mistä maista ja millä laitteilla liikenne tulee.
Merkitys yritykselle
Bot-liikenne on pk-yrityksen analytiikan ja tietoturvan suurin haaste. Jos sitä ei suodata, raportit näyttävät paljon liikennettä mutta vähän konversioita, mikä voi johtaa vääriin päätöksiin (“mainokset eivät toimi” – vaikka todellisuudessa vain 30 % liikenteestä on ihmisiä). Hyödyllinen bot-liikenne (kuten Googlebot) on tervetullutta ja sitä ei pidä estää, mutta haitallinen liikenne on tunnistettava ja torjuttava. Cloudflaren kaltainen suojaus ja Google Analyticsin bot-suodatus ovat helpot ja ilmaiset ensimmäiset askelet. Kun analytiikka perustuu todellisiin ihmisiin, päätöksenteko on luotettavampaa ja markkinointipanostukset kohdistuvat oikein.