Iscriviti alla newsletter

15 GENNAIO 2024

Come evitare gli errori più comuni nella lettura dei dati e sfruttare tutto il potenziale di Google Analytics 4

A partire da luglio 2023, con la dismissione graduale di Universal Analytics, Google Analytics 4 è diventata ufficialmente l’unica piattaforma di analisi di Google. 

Oltre a molti vantaggi e novità, la nuova piattaforma ha introdotto anche importanti differenze, tra cui insoliti tempi di elaborazione del dato e un data model inedito, che si fonda sull’elaborazione dei singoli eventi piuttosto che delle diverse sessioni.

Se è vero, infatti, che a primo impatto Google Analytics 4 sembra avere un numero inferiore di report, è altrettanto vero che questo strumento introduce la possibilità di effettuare moltissime cose che prima erano semplicemente impossibili. Dalle esplorazioni personalizzate, al collegamento nativo con BigQuery, passando per le viste con sovrapposizione dei segmenti e analisi delle conversioni con modello di attribuzione data-driven: le possibilità, per chi desidera ottenere interessanti insight e prendere decisioni business-oriented, sono moltissime.

 

Google Analytics 4: nuove funzionalità per sfruttare il valore dei dati

Ecco di seguito alcune delle funzionalità di Google Analytics 4

  • Esplorazioni personalizzate: i report della sezione Esplora offrono la possibilità di analizzare metriche e dimensioni più specifiche, applicare segmenti avanzati, filtri personalizzati e molto altro
  • Collegamento nativo con BigQuery: è possibile collegare GA4 a Google BigQuery per analisi dati più avanzate e personalizzate. In questo modo, inoltre, si beneficia di una conservazione dei dati a lungo termine
  • Modello di attribuzione data-driven: GA4 rende disponibile a tutti questo modello di attribuzione basato sui dati che determina quali touchpoint hanno più probabilità di generare conversion, permettendo di attribuire i risultati ai punti di contatto più significativi.

Per sfruttare al meglio queste nuove possibilità, tuttavia, è necessario sgomberare il campo da errori ed equivoci comuni che, in fase di analisi del dato, possono generare alcune perplessità. 

 

I dati non sono tutti uguali: differenze e peculiarità

Nel passaggio a una nuova piattaforma di raccolta e analisi dei dati, è necessario considerare che le diverse piattaforme possono presentare alcune differenze e peculiarità.

In particolare, per Google Analytics 4, è importante tenere a mente che ci sono alcuni fattori che possono influire sull’accuratezza dei dati. In questo articolo ne abbiamo raccolti tre:

  • Elevata cardinalità delle dimensioni, con presenza di valori (other) nelle tabelle
  • Approssimazione del dato tramite il nuovo algoritmo HLL++
  • Presenza del valore (not set) nei report Landing Pages

Di seguito, abbiamo raccolto maggiori informazioni per ciascuno di questi fattori e individuato alcune soluzioni per rendere i nostri report più utili e comprensibili.

 

1. Elevata cardinalità delle dimensioni

Quando si realizza un report in GA4, può succedere che alcune dimensioni principali o secondarie riportino il valore (other). La presenza di questo valore è dovuta, in particolare, all’elevata cardinalità delle dimensioni.

Se, infatti, con cardinalità intendiamo il numero di valori unici che una singola dimensione può assumere, ciascuna dimensione potrà avere:

  • Una cardinalità elevata, come nel caso degli User ID, che sono tanti quanti gli utenti che hanno visualizzato il nostro sito web nel periodo analizzato
  • Una cardinalità molto bassa, come nel caso dello status di login, che può assumere uno tra i due valori “loggato” e “non loggato”.

Quando è presente una dimensione ad alta cardinalità, che raggiunge più di 500 valori unici in un giorno, è molto probabile che la tabella superi il numero massimo di righe previsto da GA4. In questo caso, tutti i valori eccedenti vengono accorpati nel valore (other), comportando una perdita della granularità del dato e una riduzione delle possibilità di analisi.

Per ovviare a ciò, abbiamo individuato alcune soluzioni:

  • Evitare l’utilizzo di dimensioni ad alta cardinalità come User ID e Session ID nei report
  • Ridurre la cardinalità in fase di raccolta del dato, ad esempio generalizzando gli URL di una pagina attraverso un custom JavaScript su Google Tag Manager
  • Accedere ai dati in BigQuery, che non presenta gli stessi limiti dei report di GA4
  • Utilizzare un account 360, che, seppure a fronte di un costo aggiuntivo non indifferente,  presenta un limite di righe dei report più alto, oltre a limiti più elevati per la raccolta, la conservazione e l’esportazione dei dati.

 

2. Approssimazione dei dati con l’algoritmo HLL++

Quando si realizzano report su Google Analytics 4, la piattaforma deve restituire in poco tempo una grande quantità di dati.

Per impiegare una quantità inferiore di memoria e accelerare il tempo di visualizzazione, Google Analytics 4 effettua una stima dei dati attraverso l’algoritmo HyperLogLog++ (HLL++). Di fronte all’impossibilità di misurare in fretta molti elementi in modo accurato, infatti, questo algoritmo conta solo una parte dei dati ed effettua una stima accurata di quelli restanti, offrendo dati affidabili in modo veloce.

Per aggirare questa elaborazione, l’unica alternativa è l’utilizzo di BigQuery, che grazie alla funzione COUNT(DISTINCT) restituisce dati di aggregazione esatti, anche se con utilizzo di memoria e tempi di esecuzione più lunghi.

 

3. Presenza dei valori (not set) nel report Landing Pages

Per individuare quali sono i percorsi degli utenti che realizzano le migliori performance, l’analisi del report Landing Pages si rivela fondamentale. Tuttavia, all’interno di questi report è possibile individuare il valore (not set) con una certa frequenza.

Questo può essere dovuto al fatto che, in determinate sessioni, non viene registrato un evento di pageview (o di screenview). In altre parole, la sessione è generata da eventi diversi dalla visualizzazione di pagina, come ad esempio il click o l’interazione con un determinato contenuto.

Può accadere ad esempio che, una volta scaduta la sessione – ovvero, come da impostazione di default, dopo 30 minuti di inattività – l’utente riprenda la tab lasciata aperta e interagisca di nuovo con la pagina, avviando una nuova sessione a partire da un evento diverso da una pageview e generando, così, una dimensione Landing Page (not set).

In altri casi, invece, questo problema può essere generato anche da una configurazione sbagliata dei tag, che permette agli eventi di attivarsi prima del tag di configurazione di GA4.

 

Conclusioni

Ogni volta che si adotta un nuovo strumento, è necessario un periodo di apprendimento per imparare a utilizzarlo al meglio. Se, a primo impatto, la nuova piattaforma di Google Analytics può sembrare più scarna e meno esaustiva della precedente, questa nasconde moltissime potenzialità, che possono essere moltiplicate grazie all’utilizzo dei dati esportati su BigQuery.

Con il giusto affiancamento tecnico, inoltre, è possibile configurare Google Analytics nel modo migliore, ricavando il maggior valore possibile da ogni dato a nostra disposizione.

ECOMMERCE TIPS

Headless Ecommerce

Di cosa si tratta e a cosa prestare attenzione per una SEO efficace?

ECOMMERCE TIPS

Server Side Tracking

Come agire quando le transazioni su Analytics sono molto diverse dai numeri registrati sul CMS?

ISCRIVITI ALLA NEWSLETTER

RIMANIAMO IN CONTATTO?

Per te in anteprima:

  • Ricerche, report strategici e white paper
  • Case Studies
  • Inviti a workshop, eventi di formazione e webinar
  • Job alert e segnalazioni di opportunità di lavoro

Pochi invii ma di qualità, promesso!