← Takaisin sanastoon

Data Retention

Data Retention määrittää, kuinka kauan Google Analytics säilyttää käyttäjä- ja tapahtumakohtaista dataa ennen sen automaattista poistamista.

Data Retention eli datan säilytysaika on asetus, joka määrittää kuinka kauan Google Analytics 4 säilyttää käyttäjäkohtaista ja tapahtumakohtaista dataa ennen kuin se poistetaan automaattisesti. Tämä vaikuttaa Exploration-raportteihin ja yksityiskohtaiseen käyttäjäanalytiikkaan, mutta ei aggregoituihin perusraportteihin.

Data Retentionin toimintaperiaate

Google Analytics 4 erottelee datan kahteen kategoriaan:

Aggregoitu data – Kokonaisluvut kuten “kävijämäärä kuukaudessa”, “konversioaste”, “keskimääräinen istunnon kesto”. Tämä data säilytetään loputtomasti ja se näkyy perusraporteissa (Reports-osiossa).

Käyttäjäkohtainen data – Yksittäisten käyttäjien tapahtumat, joiden avulla voidaan tutkia käyttäjäpolkuja, rakentaa kohortteja ja tehdä Exploration-analyysejä. Tämä data poistetaan automaattisesti Data Retention -asetuksen mukaisesti.

Oletuksena GA4 säilyttää käyttäjäkohtaisen datan 2 kuukautta. Tämä tarkoittaa, että:

  • 2 kuukauden jälkeen et voi enää tutkia yksittäisten käyttäjien polkuja Exploration-raporteissa
  • Aggregoidut raportit (esim. “kuinka monta kävijää oli tammikuussa”) toimivat edelleen normaalisti

Säilytysaikaa voidaan pidentää asetuksista 2 kuukauteen tai 14 kuukauteen. Tätä pidempää säilytystä ei ilmaisessa GA4:ssä ole.

Miksi Data Retention on rajoitettu

Data Retention -rajoitus liittyy yksityisyyteen ja GDPR-vaatimuksiin. EU:n tietosuoja-asetus edellyttää, että henkilötietoja ei säilytetä pidempään kuin on tarpeen. Koska käyttäjäkohtainen data on henkilötietoa, Google rajoittaa sen säilytystä.

Pk-yritykselle tämä tarkoittaa, että jos haluat tutkia käyttäjien pitkän aikavälin käyttäytymistä (esim. “mitkä käyttäjät, jotka rekisteröityivät 6 kuukautta sitten, ovat edelleen aktiivisia”), tarvitset pidemmän säilytysajan tai BigQuery-integraation.

Data Retentionin vaikutus analytiikkaan

Perusraportit (Reports-osio) – Näihin ei vaikuta. Voit tarkastella esimerkiksi viime vuoden kävijämääriä normaalisti, koska ne perustuvat aggregoituun dataan.

Exploration-raportit – Näihin vaikuttaa merkittävästi. Jos säilytysaika on 2 kuukautta, et voi rakentaa Exploration-raporttia, joka tutkii 6 kuukauden aikajaksoa käyttäjätasolla.

Kohorttiraportit – Jos haluat tutkia kohortin käyttäytymistä 6 kuukauden ajan, tarvitset 14 kuukauden säilytysajan (tai BigQuery-integraation).

Käyttäjäpolut (Path Exploration) – Voit tutkia käyttäjäpolkuja vain säilytysajan sisällä. Vanhempi data ei ole enää käytettävissä.

User-ID ja mukautetut dimensiot – Nämä poistetaan säilytysajan jälkeen, joten pitkän aikavälin käyttäjäseuranta katkeaa.

Pk-yritykselle suositus on asettaa säilytysaika 14 kuukauteen, koska se ei maksa mitään ja mahdollistaa pidemmän aikavälin analyysit. 2 kuukauden säilytys on liian lyhyt useimpiin liiketoimintatarpeisiin.

Data Retention -asetuksen muuttaminen

Data Retention -asetus muutetaan GA4:n Admin-osiossa:

  1. Mene GA4:n Admin-osioon
  2. Valitse “Data Settings” → “Data Retention”
  3. Valitse “Event data retention”: 14 months
  4. Valitse “Reset user data on new activity”: Off (suositus)

“Reset user data on new activity” -asetus määrittää, alkaako säilytysaika nollautua aina kun käyttäjä palaa sivustolle. Jos se on päällä, aktiivisten käyttäjien data ei koskaan poistu. Jos se on pois päältä, data poistetaan 14 kuukauden kuluttua ensimmäisestä vierailusta riippumatta siitä, onko käyttäjä palannut.

Suositus on pitää tämä pois päältä, koska muuten säilytysaika muuttuu arvaamattomaksi ja GDPR-yhteensopivuus voi kärsiä.

Pitkäaikainen datan säilytys: BigQuery

Jos 14 kuukautta ei riitä, ainoa vaihtoehto on BigQuery-integraatio. Kun GA4-data viedään BigQueryyn, se säilytetään niin kauan kuin haluat (vuosia). BigQuery ei poista dataa automaattisesti, vaan käyttäjä hallitsee säilytystä itse.

BigQuery on ilmainen pienessä käytössä (10 GB tallennustila, 1 TB kyselyitä/kk ilmaiseksi), joten pk-yritys voi käyttää sitä ilman merkittäviä kustannuksia. Jos yritys tarvitsee pitkän aikavälin käyttäjäanalyysejä, kohorttiraportteja yli 14 kuukauden tai historian säilytystä, BigQuery on paras ratkaisu.

Yhteenveto

Data Retention määrittää, kuinka kauan GA4 säilyttää yksityiskohtaista käyttäjädataa. Oletusarvo (2 kuukautta) on liian lyhyt useimpiin tarpeisiin, joten suositus on muuttaa se 14 kuukauteen. Jos tarvitaan pidempää säilytystä, BigQuery-integraatio on ainoa vaihtoehto. Pk-yritykselle 14 kuukauden säilytys riittää useimpiin analyysitarpeisiin, mutta jos liiketoiminta perustuu pitkän aikavälin asiakasanalyysiin, BigQuery kannattaa harkita.

  • analytiikka
  • data
  • yksityisyys