【GA4】Google Analytics 4 資料閾值是什麼?

Thresholding applied in Google Analytics 4

【GA4】Google Analytics 4 資料閾值是什麼?

Google Analytics 4 資料閾值是什麼?

有注意到數據很怪嗎?報表上方怎麽出現了紅色驚歎號?還顯示「已套用門檻」?它說:「Google Analytics (分析) 已在這張資訊卡套用閾值,只有在資料達到最低匯總閾值時,資訊卡才會顯示資料。瞭解詳情」,這又是什麼意思?

這是資料閾值。它跟 UA 的資料取樣有一點點像,都是 Google 基於某些特定原因而特別模擬出的數據。這些數據的產生會讓人無法辨別其準確度以及真實性。

那到底為什麼 Google 要特別使用資料閾值在報表上呢?主要其實是為了確保使用者在報表上不被辨認出來。撇除以 User-ID 區別使用者為何人之外,Google 希望避免有心人士利用少量的資料拼湊多少可以看出某些受眾的特性以及其使用者資訊。

Google 希望避免有心人士利用少量的資料拼湊多少可以看出某些受眾的特性以及其使用者資訊。
不過這件事其實在國外也被許多人討論過,但說實在基本上使用報表是沒有辦法去辨識出這個人到底是誰的...

資料閾值是怎麽發生的呢?

只要啟用了 Google Signals (Google 信號)功能,等於可以存取使用者性別、興趣等報告,而也因為啟用了這個功能讓 Google 因此爲你的資料在其筆數少於某個數字的狀況下發生資料閾值。(大該約爲每行少於 50 個使用者 or 事件的數量下,不過真的沒有一定…)

GA4已套用門檻,資料閾值了
可以看到這個資源的人數已經快破百萬了,GA4 還是給你送了資料閾值大禮包。

Google Signals (Google 信號)是什麼?我該啟用它嗎?

在 GA4 的「管理」當中進到「資料設定」的「資料收集」功能當中就可以看到 “Google 信號資料收集” 的開關以及設定。在這邊我們可以啟用 Google Signals (Google 信號),下方其他如「精細位置和裝置資料收集」等廣告個人化設定可以依照自己的需求決定是否啟用。

Google signal啟用畫面

而也是當啟用 Google Signals (Google 信號)後才有辦法在後續的報表當中看到像是性別、興趣等報告。而好處也不止這些,也可以檢視跨裝置報告以及再行銷廣告的利用。

跨裝置報告
跨裝置報告還是很好用的東西,只是資料閾值…

簡單來說,如果你不打算啟用 Google 信號資料收集 ( Google Signals ) 的話,你可能就沒辦法:

  1. 沒辦法看跨裝置報告
  2. 沒有辦法追蹤使用者的性別、興趣等相關數據
  3. 沒辦法依照 Google Signals (Google 信號)收集的資料進行再行銷

那有辦法避免資料閾值嗎?

關於這件事其實還是有辦法的,就是關閉 Google Signals 不是啦!還要叫你關閉的話那還寫這篇幹嘛…

避免出現資料閾值的方法有以下幾種:

  1. 關閉 Google Signals
    • 這真的看個人,如果你確定用不到這些項目的話,選擇關閉也不是不可行的做法。只是我個人認為開啟的利大於弊。
  2. 盡可能的把日期區間拉長來看資料
    • 注意喔,這是不一定可行的
  3. 利用探索報表來縮小要查看的維度與指標
  4. 變更預設報表識別資訊
未取樣而且沒有資料閾值的報表
資料閾值的報表
看到上面兩個報表了嗎?看到這種畫面時我特別不爽... 都是拉七天的資料,流量也都是不小的客戶結果報表都會出現資料閾值。而且這種狀況發生時不管資料拉多長都不會改善。

利用探索報表來避免資料閾值

如果利用「探索報表」的話有時候可以解決這個資料閾值的問題。下方的截圖示範的是剛剛前面有資料閾值的資源以「最初招攬到使用者的預設管道分組」的維度以及「工作階段」的指標來查看數據。可以看到這份報表在前面我以預設報表查看時是有發生資料閾值的(預設報表顯示的指標較多,有「使用者」、「工作階段」、「互動工作階段」等…)

而使用探索報表則是爲了把這些指標減少,有點像是讓報表的負擔減輕,從而避免資料閾值的狀況發生。可以看到我一樣拉這 7 天的數據,在探索報表上只檢視這些管道的工作階段的話就不會出現資料閾值了。

image 6

變更預設報表識別資訊

避免資料閾值的最後一個方法其實也是比較推薦大家使用的做法,就是去變更報表識別資訊。

可以到「管理」當中選擇「報表識別資訊」裡選則「依據裝置」來進行報表識別。你會看到上頭寫到「這項識別資訊只評估裝置 ID。報表可能只會反映一部分的使用者。」

也不用真的被它給嚇到,因為這代表我們只用裝置來識別使用者的話,GA4 將不會使用 User-ID 、 Google Signals (Google 信號)以及模擬資料來評估你的使用者,資料量自然看起來就會比混合或者已列爲觀察項目來得少。

報表識別資訊的變更,裡頭有三個選項:混合、已列爲觀察項目以及依據裝置。

那為什麼推薦大家使用這個方式來避免資料閾值呢?主要是因為假設你今天選擇使用關閉 Google Signals(Google 信號) 來避免資料閾值的話,那麼從關閉的那天開始 GA4 幫你收集的資料完全不會有性別、興趣等相關數據,這是不可回溯的。

但變更報表識別資訊在這塊不同的是,你不管怎麽變更識別使用者的方式,它完全不會被影響到原本開啟 Google Signals (Google 信號)收集資料的方式。所以基本上是可以依照需求去切換這些識別方式的。

但也不是沒有缺點,缺點在於當切換到「依據裝置」識別報表的時候,客層報告就會沒有辦法正常查看(跟關閉 Google 信號一樣,只是資料還是正常的在累計。),講到這邊希望我說明的還算清楚哦!