在過去許多商業行為,大多依靠著主觀的經驗去決策事情,而這種經驗判斷會有很多不確定因素,對企業是一種高風險的行為。
這次透過觀察顧客過去在網站上操作的相關資訊,進而預測顧客可能帶來的商業價值,協助團隊和公司將非零收入用戶(創造商業利益的用戶)重點鎖定,降低投資策略成本(廣告投放、促銷活動)幫助企業做出更有效的顧客價值預測。
P.S. 非零收入用戶:在網站上有「實質購買並創造商業利益的用戶」
可能很常聽別人說:「最小成本與最大利潤」,在這眾所皆知的觀念背後其實有個 「80/20法則」支持著且各處應用範圍廣泛
可能會有人問什麼是「80/20法則」?舉個例子來說
許多商業組織或公司裡頭通常會有兩種狀況發生:
1. 小部分(20%)的「客戶」能為企業帶來可觀性(80%)的「收入」
2. 少部分(20%)的「產品」能為企業掙來大部份(80%)的「利潤」
本案件課題
如何有效抓住可能帶來的龐大商業價值,讓團隊或公司針對一般用戶、非零收入用戶,規劃出更完善的決策參考,將會是這次實戰案例的重點
GA分析預測顧客價值 — Python實戰應用
這次實戰案例選擇某紀念品商店所運用的GA資料(Google Analytics Data)去做相關性預測分析,以下為分析所使用的資訊:
資料檔案
在此附上真實檔案,容量較大,建議下載後在Python中開啓檢視
下載檔案 Train_data 和 Test_data
資料種類
對象:某紀念品商店的用戶
時間:可分為到訪時間、使用時間
瀏覽器:可透過之網站(Chrome、Safari、Firefox、IE)
電子設備:可運用之手機、桌電、筆電
作業系統:可運用之作業系統(Windows、Mac、Android、iOS)
流量 :可分為流量來源、流量媒體推薦等相關資訊
主要目標
透過用戶所操作的過程(軟體到硬體設備) 和用戶流量來源與媒體推薦,將原始資料結合起來搭配機器學習進而去預測用戶可帶來的顧客價值。
知識補給站:通常我們在預測時,運用均方根誤差(RMSE)公式,再搭配數據去做相關性預測:
隨著在各個專業領域裡所在意的條件不同,會導致RMSE原形公式有所延伸或改變(eg: RMSLE =(Root Mean Square Logarithmic Error))
若有興趣瞭解RMSLE的具體Python商務實作應用,請見行銷定價新型態:即時動態定價策略與實做(附實現程式碼)文章詳解!
1. 載入套件
使用套件載入python環境
2. 讀取資料集
查看資料裡所需要使用的分析變數,間接了解資料輪廓的組成
2–1.資料欄位(到訪方式、使用時間、顧客識別碼)
2–2.資料欄位(使用之網站、電子設備、作業系統)
2–3.資料欄位(流量來源、流量媒體)
3. 初步資料紀錄
將所有客戶的交易結果轉換成對數(log)用散點圖方式呈現,如下圖所示,X軸為用戶數量,Y軸為總收益,可看出符合前面所提及的「80/20法則」。
通常「交易價格」轉換成對數(log)會比較符合常態分布
4. 運用圖例分析Google Analytics 資訊
本次實戰案例的目標對象跟流量使用為主要探討方向,首先將GA上能得到的資訊轉換成到訪網站的「用戶數量」 、「非零收入(實質收入)」、「平均收入」這三個區塊,協助我們直覺性觀察哪些項目比重會有明顯變化。
4–1. 目標對象:到訪網站使用者
用戶所使用的瀏覽器排行榜
用戶數量NO.1:Chrome瀏覽器 — 使用者最多的瀏覽器
非零收入NO.1:Chrome瀏覽器 — 大量使用者的投入(小錢堆積而成)
平均收入NO.1:Firefox瀏覽器 — 小眾使用者的投入(平均客單價高)
用戶所使用的電子設備排行榜
三項(用戶、非零收入、平均收入)NO.1、:桌上型電腦 — 為大多數使用的數據來源
用戶所使用的作業系統排行榜
用戶數量NO.1:Windows — 世界最多用戶的系統,持續佔據龍頭地位
非零收入NO.1:Macintosh(MAC) — 著重系統流暢的用戶會更願意投入資源
平均收入NO.1:Chrome OS — 基於Linux上Google開發的作業系統
4–2. 流量使用:流量來源和流量媒介
流量來源:指平常所使用的網站、社群平台。
流量媒介:流量搜尋大致上分為「直接(Direct)」、 「間接(Referral)」、 「付費(Paid)」 和 「自然(Organic)」 這四種。透過流量來源引導用戶至網站的方式。
用戶所使用的流量來源排行榜
用戶數量NO.1:Google 網站 — 基本上佔據了大部分用戶使用
非零收入NO.1:Googleplex總部 — 大部分來自google總部的支持
平均收入NO.1:DFA(DoubleClick for Advertisers) — 主動性投放大量廣告
吸引用戶到訪網站的流量媒介排行榜
用戶數量NO.1:自然(Organic)搜尋 — 用戶主動性的到訪網站
非零收入NO.1:推薦(Referral)搜尋 — 親朋好友或網紅推薦到訪
平均收入NO.1:付費(Paid)搜尋 — 運用展示性廣告(CPM)吸引用戶到訪
管理意涵
在《孫子·謀功》中有段經典語句 -「知己知彼,百戰不貽;不知彼而知己,一勝一負;不知彼不知己,每戰必敗。」,其實GA還有紀錄許多用戶相關資訊,唯有了解消費顧客群(動機和習性),才能做出更好的決策。
從全部總體來看,可以掌握大部分用戶群特徵(透過使用者的軟硬體設備);
從非零收入來看,好好抓住帶來實際商業價值用戶的心(加強使用者體驗);
從平均收入來看,推廣觸及總體和非零用戶之間的用戶群(開發潛在用戶)。
其實從這三個面向來看,我們就會知道目標市場輪廓是什麼(所需使用的市場策略),得到目標市場的變數(目標客群);最後透過預測性分析去決定哪個變數重要;這部份將會在下一篇探索Google Analytics(GA)顧客商機秘密 — 預測性分析與管理意涵- 系列2-(附Python程式碼)為大家揭曉~~~
作者:洪亦霆(臺灣行銷研究行銷資料科學工程師)