Duplicate content (päällekkäinen sisältö) tarkoittaa identtistä tai lähes identtistä sisältöä, joka esiintyy useammassa eri URL-osoitteessa joko saman sivuston sisällä tai eri sivustojen välillä. Hakukoneet eivät tiedä, mikä versio näyttää hakutuloksissa, mikä voi heikentää kaikkien versioiden sijoituksia.
Miten duplicate content syntyy?
Duplicate content syntyy usein tahattomasti teknisistä syistä. Tyypillisiä aiheuttajia ovat www- ja ei-www-versiot samasta sivusta, HTTP- ja HTTPS-versiot, URL-parametrit (kuten lajittelu- tai seurantaparametrit), tulostusversiot sivuista sekä sivuston mobiili- ja työpöytäversiot eri URL-osoitteissa.
Myös CMS-järjestelmät voivat luoda duplicate contentia automaattisesti. Esimerkiksi tagisivut, kategorisivut ja arkistosivut voivat toistaa samaa sisältöä useissa eri osoitteissa. Verkkokaupat ovat erityisen alttiita duplicate contentille, kun sama tuote näkyy useissa kategorioissa.
Tietoinen sisällön kopioiminen muilta sivustoilta on toinen duplicate content -muoto, ja se voi johtaa vakavampiin seuraamuksiin hakukonenäkyvyydessä.
Duplicate contentin vaikutus hakukoneoptimointiin
Kun Google löytää saman sisällön useasta osoitteesta, sen on valittava yksi versio indeksoitavaksi. Tämä valinta ei aina ole se, jonka sivuston omistaja toivoo. Linkkivoima jakautuu eri versioiden kesken, ja väärä versio voi päätyä hakutuloksiin.
Google ei yleensä rankaise tahattomasta duplicate contentista, mutta se voi suodattaa duplikaattisivut pois hakutuloksista. Tahallinen sisällön kopiointi voi kuitenkin johtaa manuaalisiin toimenpiteisiin.
Miten duplicate content ratkaistaan?
Tärkein tekninen ratkaisu on canonical-tagi (<link rel="canonical">), joka kertoo hakukoneelle, mikä URL on sivun ensisijainen versio. Tämä yhdistää kaikkien duplikaattiversioiden linkkivoiman yhteen osoitteeseen.
301-uudelleenohjaukset ovat toinen tehokas ratkaisu. Ne ohjaavat kaikki duplikaattiosoitteet pysyvästi ensisijaiseen versioon. Tämä sopii erityisesti www/ei-www ja HTTP/HTTPS-ongelmiin.
Google Search Console -työkalun “URL-tarkastus” näyttää, minkä canonical-version Google on valinnut kullekin sivulle. Tämä auttaa tunnistamaan ja korjaamaan ongelmat.
Yhteenveto
Duplicate content on yleinen tekninen ongelma, joka voi heikentää sivuston hakukonenäkyvyyttä. Pk-yrityksen kannattaa varmistaa, ettei sivustolla ole tahattomia duplikaatteja, ja käyttää canonical-tageja ja uudelleenohjauksia ongelmien ehkäisemiseen. Proaktiivinen lähestymistapa säästää paljon korjaustyötä myöhemmin.