如何克服 Google Data Studio 中數據混合的限制
已發表: 2021-11-12如果您是 Google Data Studio 高級用戶,那麼您很可能已經使用過數據混合功能。
這是一項很棒的功能,可讓您快速豐富和釋放數據的潛力。 特別是如果您沒有時間從多個來源提取數據並將它們組合到電子表格中。
但是,數據混合也有一些限制,可能會減慢您的報告速度,最壞的情況是影響您的數據準確性。
在本文中,我們與團隊中的兩位專家 Bartosz Schneider 和 Evan Kaeding 合作,討論了 Data Studio 中數據混合的優缺點,以及如何避免所有令人頭疼的問題。
為了確保我們在同一頁面上,讓我們先看看基礎知識。
數據連接的基礎知識
什麼是數據連接?
假設您正在管理一家在線商店。 您正在流行的社交媒體平台上投放付費廣告。 您想知道哪些渠道帶來的收入最多。 為此,您需要將付費社交數據與 Shopify 中的數據相結合。
或者您想查看您的電子商務渠道的外觀。 例如,客戶在購買前訪問了哪些頁面以及他們在購物車中添加了哪些產品。 在這種情況下,您可以將 Google Analytics 數據與 Shopify 數據連接起來。
這是對數據連接的粗略描述。 每當您將來自多個數據源的數據連接到單個數據集時,您就是在執行數據連接。 當您的聯接數據源共享至少一個公共維度或“聯接鍵”時,數據聯接就起作用。
通常,企業從不同來源積累數據。 如果不結合所有數據,您將錯過您的整體表現。 數據加入可以幫助您:
- 從不同的數據源中發現有價值的見解。
- 發現數據集之間有意義的關係。
- 做出更好的數據知情決策。
不同類型的連接
- 內連接意味著合併來自兩個源的數據——在連接鍵相同的地方匹配它,並刪除不匹配的數據。
- 外連接意味著從兩個來源獲取所有數據——在連接鍵相同的地方進行匹配。 最後,在連接表中,用空值填充不匹配的列。
- 左連接是指從左表中取出所有數據,並從右表中取出連接鍵相同的匹配數據。
- 類似地,右連接意味著從右表中獲取所有數據,並從左表中獲取連接鍵相同的匹配數據。

那麼,數據加入與數據混合有什麼關係嗎?
劇透警報:確實如此。 Data Studio 中的數據混合是左外連接。
Google 數據洞察中的數據混合
默認情況下,當您在 Google Data Studio 中創建圖表時,您會從單個數據源中提取數據。 但是,您可以連接多個數據源,並通過數據混合在圖表或表格中將它們一起可視化。
數據混合是左外連接
要混合數據,您需要選擇:
- 主要來源:您添加到“混合數據面板”的第一個(或最左邊的)數據源。
- 至少一個輔助源:添加到主源右側的任何數據源
- 一個連接鍵
由於 Data Studio 中的數據混合是左外連接,因此混合數據將包括來自主數據源的所有數據以及來自共享相同連接鍵的輔助數據源的匹配數據。
讓我們看一下下面的例子。
在這裡,Google Ads 擁有來自五個國家/地區的轉化數據:美國、德國、芬蘭、法國和澳大利亞。
Facebook Ads 擁有來自七個國家/地區的轉化數據:美國、德國、法國、愛爾蘭、印度、新加坡和西班牙。

如果您選擇 Google Ads 作為主要數據源,則混合結果將僅顯示來自美國、德國、芬蘭、法國和澳大利亞的轉化。 由於愛爾蘭、印度、新加坡和西班牙未包含在 Google Ads(您的主要來源)中,因此數據將從混合表中排除。
您還可以看到,在 Google Ads 表中而不在 Facebook Ads 表中具有數據的芬蘭將保留在混合表中。 但是,其 Facebook 廣告轉化價值將為“空”。

或者,如果 Facebook 廣告是您的主要來源,您的結果將是來自美國、德國、法國、愛爾蘭、印度、新加坡和西班牙的轉化數據。


“主表中不存在的任何數據都將丟失,這是您必須注意的第一件事。 選擇最長的表作為主要來源(混合的左表)是有意義的。 否則,您可能會在此過程中丟失一些重要數據。”Bartosz Schneider,Supermetrics 首席分析顧問
在 Google 數據洞察中,您引入“混合數據”視圖的第一個數據源是您的主要來源。 更改數據源的順序非常簡單。 您所要做的就是將數據源拖放到您想要的位置。

如何創建混合數據源
您可以使用兩種方法來混合數據。
第一種方法非常快速和簡單。 如果您有兩個具有共同維度的表,則可以選擇這兩個表,右鍵單擊並選擇“混合數據”。 Data Studio 將快速將兩張表合二為一。 然後,根據源表中提供的字段自動生成混合數據視圖。

第二種方法需要更多步驟,但它可以讓您對數據進行更多控制。
首先,單擊“資源”→“管理混合數據”。

接下來,通過單擊“添加數據視圖”打開“混合數據”視圖。
然後,添加要混合的數據源。 請記住,您添加到視圖中的第一個數據源將成為您的主要來源。

從這裡,您可以選擇要混合的連接鍵、維度和指標。
提示:為您的混合數據源命名,以便稍後與其他源區分開來。

對設置滿意後,單擊“保存”。
通過將混合數據源添加到“數據源”字段,開始使用混合數據源構建圖表。

Google Data Studio 中數據混合的局限性
準確性
傳統上,當您在電子表格中加入數據時,您可以使用不同的公式來準確地告訴計算機您要檢索哪些數據。 這使您可以查看每個步驟中的數據發生了什麼。 如果發生錯誤,您始終可以返回原始數據並跟踪問題。
但是,使用 Data Studio,連接發生在幕後,因此如果混合數據有錯誤,您將不知道是什麼導致了問題。

“在 Data Studio 中,你真的沒有辦法檢查你加入的數據。 所以你有點盲目。 檢查非常困難。 無法知道 Google 做了什麼,Data Studio 是否會產生重複項,或者無法了解如果字段不匹配是否會被刪除。”Evan Kaeding,Supermetrics 高級銷售工程師
僅支持左外連接
如上所述,Google Data Studio 中的數據連接始終是左外連接。 如果您習慣於使用不同類型的連接來豐富您的數據,這可能會有所限制。
混合數據時必須格外小心,尤其是加入它們的順序。 主要來源的一個問題可能會損害混合結果的準確性。
速度
您可能會注意到 Google Data Studio 可以花時間加載您的報告。 當您將數據混合帶到圖片中時,情況會變得更糟。
每當您創建混合數據源時,Google 都必須通過不同的 API 來檢索數據。 這個過程需要相當多的計算能力。
添加的混合數據源越多,儀表板的速度就越慢。
有限數量的混合源
另一個令人沮喪的限制是您最多可以混合五個數據源。 雖然這個數字聽起來很多,但事實並非如此。 有時,在許多高級和深入的報告中,您需要混合來自五個以上來源的數據。 如果您想創建一個包含許多列的非常詳細的表格,您將很容易突破限制。
那麼,您是否應該避免所有麻煩並避免數據混合?
平心而論,Google Data Studio 在簡單輕巧的混合方面做得非常出色。 因此,如果您想使用簡單的連接鍵(如日期)混合一到兩個數據源,您可以堅持使用 Data Studio。
另一方面,如果您希望獲得對數據的更多控制權並進行更高級的混合,那麼 Google 表格是您的最佳選擇。
Google 表格中的數據混合
當 Google Data Studio 中的數據混合變得有點麻煩時,您可以在 Google Sheets 中混合您的數據,然後將其重新組合到 Data Studio 中以進行報告。
這種方法為您的數據提供了更大的靈活性。 您可以利用 Google 表格公式來豐富您的數據。 此外,從 Google 表格加載混合數據比從多個來源加載要快得多。
此外,您可以使用 Supermetrics 自動將數據提取到 Google 表格中。 您將有更多時間去做自己擅長的事情——分析數據並獲得有意義的見解。
在幾分鐘內將您的數據轉移到 Google 表格中
開始為期 14 天的免費 Supermetrics 試用。 功能齊全。 無需信用卡。
讓我們看一下在 Google 表格中加入數據的一些技巧。
在 Google 表格中管理您的數據
當您將來自不同來源的數據帶到 Google 表格進行混合時,它會很快變得混亂。 保持數據井井有條的一個好方法是將它們分成單獨的選項卡。

“將數據分成三個存儲桶是個好主意——原始數據、混合數據和報告數據。 所以基本上,您希望能夠對原始圖層和混合圖層進行更改。 但是你希望最終報告盡可能乾淨。”Even Kaeding,Supermetrics 高級銷售工程師
“原始數據”選項卡是您存儲來自數據源的所有未格式化原始數據的地方。 在這個示例報告中,我們使用 Supermetrics 將來自 Facebook、Microsoft 和 Google Ads 的數據提取到三個單獨的選項卡中。

“混合數據”選項卡是神奇發生的地方。 您可以將數據匹配在一起並執行一些計算,以從數據中獲得更多見解。


“報告數據”選項卡是您放置最後一塊拼圖的地方。 當您完成數據的豐富和轉換後,您可以將它們顯示在一個單獨的選項卡中,以便於監控。
此外,您可以將“報告數據”選項卡連接到 Google Data Studio,以將最終結果帶到您的信息中心。 您可以在連接器庫中找到 Google 表格連接器。

接下來,我們來看看在 Google Sheets 中混合數據時需要了解的一些功能。
在 Google 表格中加入數據的三個有用功能
查找
VLOOKUP 是數據連接中最常用的功能之一。 它允許您在一個表中搜索一個值並在另一個表中使用它。
VLOOKUP 的語法是:
VLOOKUP (search_key, range, index, [is_sort])
- search_key :您要查找的值。
- range :包含要查找的值的範圍。 請注意,VLOOKUP 將從您範圍內的第一列開始搜索。
- index :包含返回值的列號(在您選擇的範圍內)。
- is_sort :此參數是可選的。 在這裡,您可以指定是否要接收完全匹配 (FALSE) 或最接近的匹配值 (TRUE)。 在數據連接的情況下,您需要將其設置為完全匹配。
您是在告訴 Google 表格您要搜索什麼值、要在哪裡搜索、要返回該值的範圍內的列號,以及最後,如果您想接收完全匹配 (FALSE) 或最接近的匹配 (TRUE)。
假設您有兩個表:
- 包含有關日期、來源、媒介、活動、印象、成本和點擊數據的營銷表
- 包含有關日期、來源、媒介、交易和收入的數據的轉換錶。

根據 Bartosz 的說法,連接謎題有兩個步驟。
首先,您需要使用 TEXTJOIN 函數為兩個表創建複合鍵。 每個複合鍵可用於唯一標識表的每一行。 如果沒有復合鍵,您可能會遇到一對多的關係。 此外,您可以將它們用作 VLOOKUP 的連接鍵。
您的複合鍵將包括廣告系列的日期、來源、媒介和廣告系列(在本例中表示廣告系列名稱)。 它看起來像這樣。

接下來,使用 VLOOKUP 連接兩個表。 例如,交易數據與營銷表的組合公式為:
VLOOKUP($A4,$A$22:$J$33,6,0)
提示:使用絕對引用可以讓 Google 更輕鬆地搜索值並讓您在電子表格中拖動公式。
簡而言之,Google 在第一列中搜索組合鍵並返回相應的交易。

IF + 正則匹配
第一步是使用 IF 函數(F 列和 N 列)將活動名稱重新映射為新值。 然後,新的清理後的名稱用作連接鍵,以在工作表右側生成指標表,其中來自兩個來源的指標在先前重新映射的活動名稱匹配的地方聚合在一起。
我們接下來要看的函數是一個嵌套函數——IF + REGEXPMATCH,其中
- IF 開始條件評估。
- REGEXPMATCH 檢查目標文本匹配
Bartosz 發現當他需要從一個或多個不同的數據源重新映射活動名稱時,此功能會派上用場。
讓我們看一下下表。 如您所見,它有不同的命名約定,例如“Google Data Studio”和“googledatastudio”或“Enterprise”和“enterprise”。

您可以使用以下公式將所有 Google Data Studio 廣告系列放在一個籃子中,將 Enterprise 廣告系列放在一個籃子中:
=IF(
REGEXMATCH(A7,"Data Studio|datastudio"),"Data Studio Campaigns",
IF(REGEXMATCH(A7,"Enterprise|enterprise"),"Enterprise campaigns"
))
簡而言之,您的函數在 A7 列中搜索“Data Studio”或“datastudio”並返回“Data Studio Campaigns”。 如果沒有這樣的值,請搜索“企業”或“企業”並返回“企業活動”。
您可以重新映射來自不同來源的活動名稱並將它們用作您的加入鍵。
條件聚合
在 Google 表格中,您可以使用不同的聚合函數來匯總數據——計算總和、平均值或計算數據點的數量。 但是,實際上,您可能不想匯總您擁有的所有數據。 在這種情況下,您可以使用條件聚合來指定要聚合的數據。
條件聚合是一種功能,它告訴 Google 在滿足特定條件時對一組數據執行數據聚合。 我們將看看一些常見的條件聚合函數。
SUMIF 函數告訴 Google 計算在某個範圍內滿足預定義條件的數據的總和。 SUMIF 函數的語法是:
SUMIF (range, criterion, [sum_range])
- range :您要指定要應用條件的數據范圍。
- 標準:您應該指定定義哪些單元格將被求和的條件。
- sum_range :如果與“範圍”不同,則應指定要求和的範圍。 這是可選的。
以下表為例。 假設您要計算來自美國的展示次數。 您可以使用 SUMIF (B3:J12, “US”, D3:D12)
來做到這一點。

AVERAGEIF 函數返回一個範圍內滿足特定條件的數據的平均值。 AVERAGEIF 函數的語法是:
AVERAGEIF (criteria_range, criterion, [average_range])
- 條件範圍:您應該選擇要應用條件的數據范圍。
- 標準:指定定義哪些單元格將被平均的條件。
- average_range:如果與“criteria_range”不同,您應該指定要平均的範圍。 這是可選的。
例如,如果要計算美國的平均成本,可以使用AVERAGEIF(B3:J12, “US”, E3:E12)
。

同樣,COUNTIF 函數對您的數據執行條件計數。 COUNTIF 的語法是:
COUNTIF (range, criterion)
- range :您要計算的範圍。
- 標準:您要應用的條件。
例如,您想計算 CPC 大於 1 的國家/地區的數量。您可以使用COUNTIF(H3:H12, “>1”)
來實現。

使用數據混合的不同方法
您可以通過多種方式將數據混合付諸實踐。 我們將看一下本節中的一些示例。 此外,您還可以找到一些包含混合數據的現成模板,您可以立即使用這些模板。
請注意,將數據源連接到模板將自動開始您的 14 天免費 Supermetrics 試用。
比較您的 Facebook 廣告與 Google Ads 的效果
Google Ads 和 Facebook Ads 是最受歡迎的廣告平台之一。 儘管這不是一個精確的比較,但將 Facebook Ads 數據與 Google Ads 數據相結合可以告訴您哪些類型的活動在哪些渠道上效果最好。
例如,在下面的 Google Ads 與 Facebook Ads 儀表板中,您可以輕鬆看到:
- 每個通道的並排性能。
- 兩個渠道之間的費用、展示次數、點擊次數和轉化次數的分配。
- 按渠道劃分的效果最佳的廣告系列。

滑動 Google Ads 與 Facebook 廣告模板 >>
有機社交媒體
管理您公司的社交媒體帳戶不是在公園裡散步。 一方面,您必須管理至少三個不同的帳戶,所有這些帳戶對內容都有不同的算法和要求。
融合來自社交媒體平台的數據可幫助您輕鬆管理自己的表現並保持社交遊戲的領先地位。
例如,在下面的儀表板中,我們結合了來自四個流行社交媒體渠道的數據——Facebook、Instagram、Twitter 和 LinkedIn。 此儀表板非常適合:
- 跨渠道監控您的表現。
- 比較不同渠道的表現。
- 深入了解每個頻道的表現。

滑動社交媒體組合儀表板>>
付費頻道組合
您可能在付費渠道平台中擁有績效營銷數據,在 Google Analytics 中擁有會話和轉化數據。 將付費廣告數據與網絡分析數據相結合,可以幫助您了解哪些活動和渠道帶來了高質量的流量。
例如,在這個付費渠道組合儀表板中,我們將來自 Google、LinkedIn、Twitter、Facebook、Microsoft 的付費數據與 Google Analytics 數據相結合。 有了它,你會看到:
- 您的付費廣告系列的一般概述。
- 您的表現與上一時期的比較。
- 一張表格,顯示您表現最佳的渠道的關鍵指標。

獲取付費頻道組合儀表板>>
自然搜索與付費搜索分析
這與自然搜索與付費搜索無關。 為了發展您的業務,您需要兩者。 例如,績效營銷人員可以查看排名靠前的搜索詞組,並決定對這些關鍵字進行出價是否有意義。
同樣,內容營銷人員也可以使用付費搜索數據來推動他們的內容策略。
在這個自然搜索與付費搜索分析模板中,我們在 OIKIO 機構的朋友結合了來自 Google Ads 和 Google Search Console 的數據。 它可以幫助您推動兩個渠道的轉化。 有了它,您可以確定:
- 您未包含在自然搜索中的 Google Ads 詞組效果。
- 您尚未使用 Google Ads 出價的自然搜索詞組效果。
- 特定搜索詞組的 PPC/SEO 比率。

滑動自然搜索與付費搜索分析模板>>
自然流量和關鍵詞分析
當谷歌從谷歌分析中刪除搜索詞組數據時,這非常令人沮喪。 但不要擔心,因為有解決方法。 通過將來自 Google Search Console 的數據與 Google Analytics 數據相結合,您將找出哪些自然關鍵字為您的網站帶來了流量。
讓我們來看看我們在 OIKIO 的朋友的這個有機流量和關鍵詞分析模板。 使用此模板,您可以:
- 找出哪些搜索詞組帶來的流量最多。
- 比較不同著陸頁的性能。

獲取有機流量和關鍵詞分析模板>>
交給你
恭喜,您已完成本文的結尾。 現在拍拍自己的背。
畢竟,數據混合可以幫助您充分利用數據並發現更有意義的見解。
如果您正在處理少量且可管理的數據,則完全可以利用 Google Data Studio 中的數據混合功能。
另一方面,如果您要處理更大的數據集並希望更好地控制您的數據,那麼 Google 表格是一個更好的解決方案。
請記住,當您在將數據轉移到 Google 表格方面需要幫助時,可以開始為期 14 天的 Supermetrics 免費試用。