卡方檢定 — Python實戰:商務資料結構整理(附Python程式碼)

一、讀取資料

import pandas as pddata = pd.read_csv('chisquare.csv', encoding = 'big5')
圖 1 原始資料示意圖「data」
data = data[data['產品']=='產品1']
圖 2 「產品1」原始資料
data = data.drop(columns = ['Unnamed: 0', '產品', '訂單時間', '會員', '尺寸', '顏色'])
圖 3 整理欄位後資料
data = data.dropna()
圖 4 刪除含遺失值行列後,保留資料皆十分完整
data = data.reset_index().drop(columns='index')
圖 5 資料重新編號後,閱讀上更輕易掌握資料確切位置

恭喜你!

完成這步驟,就代表分析前資料整理已經大致完成。

二、進階資料整理

from collections import Counter
frequency_count = Counter(data['廣告'])
圖 6 各廣告產生的銷售頻率表-frequency_count
f1 = list(frequency_count.keys())
f2 = list(frequency_count.values())
frequency_table = pd.DataFrame(zip(f1,f2),
columns=['廣告名稱','頻率'])
圖 7 廣告名稱清單「f1」
圖 8 廣告造成的銷售頻率「f2」
圖 9 廣告銷售頻率表-frequency_table
frequency_table = frequency_table.sort_values(by = '頻率', ascending = False)
圖 10 排序後廣告銷售頻率表
frequency_table = frequency_table.iloc[0:3,:]
圖 11 頻率前三名的廣告銷售頻率表
ad_name = frequency_table['廣告名稱'].tolist()
圖 12 頻率前三名廣告名稱-ad_name
save = []
for i in range(0,data.shape[0]):
a = data.iloc[i,0]
if ad_name[0] == a:
save.append('是')
elif ad_name[1] == a:
save.append('是')
elif ad_name[2] == a:
save.append('是')
else:
save.append('否')
data['是否為熱門廣告'] = save
圖 13 整理後data
data = data[data['是否為熱門廣告']=='是']
圖 14 熱門廣告銷售頻率表

加油~距離完成卡方檢定所需使用的資料就只剩最後一步了!

M_1 = data[data['廣告']==ad_name[0]][data['性別']=='MALE'].shape[0]M_2 = data[data['廣告']==ad_name[1]][data['性別']=='MALE'].shape[0]M_3 = data[data['廣告']==ad_name[2]][data['性別']=='MALE'].shape[0]list1 = [M_1, M_2, M_3]
圖 15 熱門廣告前三名之男性銷量
F_1 = data[data['廣告']==ad_name[0]][data['性別']=='FEMALE'].shape[0]F_2 = data[data['廣告']==ad_name[1]][data['性別']=='FEMALE'].shape[0]F_3 = data[data['廣告']==ad_name[2]][data['性別']=='FEMALE'].shape[0]list2 = [F_1, F_2, F_3]
圖 16熱門廣告前三名之女性銷量
chi_table = pd.DataFrame(zip(list1, list2), columns=['男性', '女性'],index=[ad_name[0], ad_name[1], ad_name[2]])
圖 17 廣告-性別交叉比較表:chi_table
歡迎加入我們的Telegram獲取即時訊息!https://t.me/marketingdatascience
歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

現在報名課程享56折起優惠!

您可能有興趣:

📢熱騰騰~最新募資上架【TMR最新募資課程】

《Python行銷資料科學-基礎語法入門最前線》

📢【TMR 已上架課程】

👨‍🎓TMR為您量身打造「全方位數據課程」

《 Python 0到1 基礎商業數據分析實戰 》

《 顧客分類大師:Python x RFM 會員經營新觀點 》

--

--

--

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
行銷資料科學

行銷資料科學

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR

More from Medium

4 Self-honoring practices for challenging times

F.U.V. with Bob Bicknell-Knight of isthisit?

Clem’s “Locals” Playlist

Book Review: Eye on Cricket — Reflections on the great game, Samir Chopra