A partire da luglio 2023, con la dismissione graduale di Universal Analytics, Google Analytics 4 è diventata ufficialmente l’unica piattaforma di analisi di Google.
Oltre a molti vantaggi e novità, la nuova piattaforma ha introdotto anche importanti differenze, tra cui insoliti tempi di elaborazione del dato e un data model inedito, che si fonda sull’elaborazione dei singoli eventi piuttosto che delle diverse sessioni.
Se è vero, infatti, che a primo impatto Google Analytics 4 sembra avere un numero inferiore di report, è altrettanto vero che questo strumento introduce la possibilità di effettuare moltissime cose che prima erano semplicemente impossibili. Dalle esplorazioni personalizzate, al collegamento nativo con BigQuery, passando per le viste con sovrapposizione dei segmenti e analisi delle conversioni con modello di attribuzione data-driven: le possibilità, per chi desidera ottenere interessanti insight e prendere decisioni business-oriented, sono moltissime.
Google Analytics 4: nuove funzionalità per sfruttare il valore dei dati
Ecco di seguito alcune delle funzionalità di Google Analytics 4:
Per sfruttare al meglio queste nuove possibilità, tuttavia, è necessario sgomberare il campo da errori ed equivoci comuni che, in fase di analisi del dato, possono generare alcune perplessità.
I dati non sono tutti uguali: differenze e peculiarità
Nel passaggio a una nuova piattaforma di raccolta e analisi dei dati, è necessario considerare che le diverse piattaforme possono presentare alcune differenze e peculiarità.
In particolare, per Google Analytics 4, è importante tenere a mente che ci sono alcuni fattori che possono influire sull’accuratezza dei dati. In questo articolo ne abbiamo raccolti tre:
Di seguito, abbiamo raccolto maggiori informazioni per ciascuno di questi fattori e individuato alcune soluzioni per rendere i nostri report più utili e comprensibili.
1. Elevata cardinalità delle dimensioni
Quando si realizza un report in GA4, può succedere che alcune dimensioni principali o secondarie riportino il valore (other). La presenza di questo valore è dovuta, in particolare, all’elevata cardinalità delle dimensioni.
Se, infatti, con cardinalità intendiamo il numero di valori unici che una singola dimensione può assumere, ciascuna dimensione potrà avere:
Quando è presente una dimensione ad alta cardinalità, che raggiunge più di 500 valori unici in un giorno, è molto probabile che la tabella superi il numero massimo di righe previsto da GA4. In questo caso, tutti i valori eccedenti vengono accorpati nel valore (other), comportando una perdita della granularità del dato e una riduzione delle possibilità di analisi.
Per ovviare a ciò, abbiamo individuato alcune soluzioni:
2. Approssimazione dei dati con l’algoritmo HLL++
Quando si realizzano report su Google Analytics 4, la piattaforma deve restituire in poco tempo una grande quantità di dati.
Per impiegare una quantità inferiore di memoria e accelerare il tempo di visualizzazione, Google Analytics 4 effettua una stima dei dati attraverso l’algoritmo HyperLogLog++ (HLL++). Di fronte all’impossibilità di misurare in fretta molti elementi in modo accurato, infatti, questo algoritmo conta solo una parte dei dati ed effettua una stima accurata di quelli restanti, offrendo dati affidabili in modo veloce.
Per aggirare questa elaborazione, l’unica alternativa è l’utilizzo di BigQuery, che grazie alla funzione COUNT(DISTINCT) restituisce dati di aggregazione esatti, anche se con utilizzo di memoria e tempi di esecuzione più lunghi.
3. Presenza dei valori (not set) nel report Landing Pages
Per individuare quali sono i percorsi degli utenti che realizzano le migliori performance, l’analisi del report Landing Pages si rivela fondamentale. Tuttavia, all’interno di questi report è possibile individuare il valore (not set) con una certa frequenza.
Questo può essere dovuto al fatto che, in determinate sessioni, non viene registrato un evento di pageview (o di screenview). In altre parole, la sessione è generata da eventi diversi dalla visualizzazione di pagina, come ad esempio il click o l’interazione con un determinato contenuto.
Può accadere ad esempio che, una volta scaduta la sessione – ovvero, come da impostazione di default, dopo 30 minuti di inattività – l’utente riprenda la tab lasciata aperta e interagisca di nuovo con la pagina, avviando una nuova sessione a partire da un evento diverso da una pageview e generando, così, una dimensione Landing Page (not set).
In altri casi, invece, questo problema può essere generato anche da una configurazione sbagliata dei tag, che permette agli eventi di attivarsi prima del tag di configurazione di GA4.
Conclusioni
Ogni volta che si adotta un nuovo strumento, è necessario un periodo di apprendimento per imparare a utilizzarlo al meglio. Se, a primo impatto, la nuova piattaforma di Google Analytics può sembrare più scarna e meno esaustiva della precedente, questa nasconde moltissime potenzialità, che possono essere moltiplicate grazie all’utilizzo dei dati esportati su BigQuery.
Con il giusto affiancamento tecnico, inoltre, è possibile configurare Google Analytics nel modo migliore, ricavando il maggior valore possibile da ogni dato a nostra disposizione.
Per te in anteprima:
Pochi invii ma di qualità, promesso!