數據分析的領導者 — 爲什麼要使用Python語言呢?

行銷資料科學
12 min readOct 15, 2020

--

市面上的程式語言有千千百百種,每個語言都有它的特定功用,像是:JavaScript適合用來開發web、C語言可以用來作為作業系統和編譯器的開發…等等,每個語言各司其職,但也可以互相cover彼此的不足,這就是程式語言的強大威力!

也因為各個語言的基礎邏輯是相通的,例如:變數、判斷式、迴圈、函數…等等,所以當你瞭解了其中一種語言的語法及邏輯架構,再學習其他語言時就能更駕輕就熟了。

程式語言熱門評比!

TIOBE Index 是一個熱門程式語言的排行榜,它每個月會根據各搜尋引擎的數據資料,如:Google、Wikipedia、Yahoo…等平台,排名出最受歡迎的程式語言,而2020年9月的前五名分別是C、Java、Python、C++及C#(如下圖一

圖一、2020年9月的 TIOBE Index 排行榜

其中最受矚目的莫過於近年逐漸崛起的Python,在17年間晉升了10個名次來到排行第三名(如下圖二

圖二、 TIOBE Index Python的歷年排名

為什麼Python會如此受到歡迎呢?

除了容易撰寫直觀而受到初學者的喜愛外,其功能強大、方便使用的函示庫大大增加了這個語言的應用範圍,包括目前最熱門的機器學習物聯網人工智慧都位在Python的範疇中。此外,對於本篇文章中所探討的「數據分析」Python也是此領域頂尖的佼佼者,我們將以下方的例子來做佐證。

案例簡介

Kaggle 是現今最熱門的數據科學競賽平台,企業和研究者可以在上面發布問題及數據集,全世界優秀的資料科學家則在平台上進行競賽以產出最好的模型。

今天我們會以Kaggle上的一場競賽 2019 Machine Learning and Data Science Survey” 的數據集來做研究,此份數據是源自於2019年針對資料科學及機器學習的使用者所做的調查,詢問了34個問題並蒐集了19,717筆數據,這其中我們將進一步對「程式語言」相關的問題來做分析,下列是相關的三個問題及選項。

Q5. Select the title most similar to your current role (or most recent title if retired): - Selected Choice
- Data Scientist
- Software Engineer
- Data Analyst
- Research Scientist
- Business Analyst
- Product/Project Manager
- Data Engineer
- Statistician
- DBA/Database Engineer
- Not employed
- Student
Q18. What programming languages do you use on a regular basis? (Select all that apply) - Selected Choice
- Python
- R
- SQL
- C
- C++
- Java
- Javascript
- TypeScript
- Bash
- MATLAB
Q19. What programming language would you recommend an aspiring data scientist to learn first? - Selected Choice
- Python
- R
- SQL
- C
- C++
- Java
- Javascript
- TypeScript
- Bash
- MATLAB

程式語言使用者調查分析

一、推薦給入門者的程式語言

以下為Q19的統計資料,可以得知Python是備受推薦的入門語言,且大幅領先其他選項,如圖三。應可歸因於Python語法直覺且較接近自然語言,因此使用者較容易理解程式邏輯及架構。

圖三、推薦的程式語言排名

二、各語言使用者推薦的程式語言

接下來,我們進一步針對不同的語言使用者來做分析。
圖四的每個灰色矩形是不同語言使用者所填答的內容,矩形內各種顏色的方框是此語言使用者推薦的程式語言,而方框的大小代表其所占的比例,越大表示越多使用者推薦使用。

各語言使用者對於Python推薦使用的比例皆在60%以上,依據下圖的結果更能明顯的看到Python幾乎壟斷了全部的市場!

Python的藍色方框代表其得到各語言使用者的喜愛,可以得知Python使用者一用就愛不釋手。而在這個講求大數據的時代,Python逐漸完整的機器學習套件如:Scikit-learn,提供了大量常見的機器學習演算法,使Python跟上現今電腦學界最熱門的趨勢,這應是受到其他使用者大力推薦的原因之一。

圖四、各語言使用者推薦的程式語言

三、不同職業推薦的程式語言

藉由下方的圖五,可以發現在「資料科學家」、「資料分析師」、「商業分析師」的調查結果中Python的推薦比例也是最高的, 所以對於資料分析從業人員來說,根據其使用經驗,Python應是不可或缺的工具之一。

圖五、各職業的推薦使用語言

而「統計學家」、「資料庫管理員/工程師」的調查結果卻不盡相同(參考圖六圖七),它們的第一名分別是R語言及SQL。

圖六、「統計學家」的推薦語言
圖七、「資料庫管理員/工程師」的推薦語言

推論應該是R語言統計分析(如:stats)、視覺化(如:ggplot2)上的功能強大! 基本上各種統計方法皆能在R上快速的實現,並且能將複雜的資料使用圖表或動圖的方式呈現出來,因此R語言榮登「統計學家」第一名的程式語言也是實至名歸的。

此外,R的語法與Python相比之下更為簡潔,可以將艱澀複雜的統計模型演算法用更容易理解的方式呈現出來,因此R語言在資料分析的使用上其表現也不可小覷。

SQL用於建立、查詢、更新及管理關聯式資料庫系統,簡單來說,SQL就是程式與資料庫間溝通的橋梁,所以對於「資料庫管理員/工程師」來講至關重要,也是工作上主要使用的語言。

來幫大家結論一下~

PythonR語言皆是當今資料科學領域中最熱門的程式語言,這兩種語言各有其優缺點,也有其專攻的應用領域。以作者自身的資料分析經驗,兩者都是資料分析不可或缺的工具,可以根據職業與資料處理的需求來選擇最適合的工具。

本文建議若是在進行資料整理使用機器學習演算法或是執行深度學習,Python是您最佳的選擇;若在進行數據檢視製作視覺化圖表或是統計分析,R語言能夠大大助你一臂之力。

兩種語言相輔相成,是進行資料分析的最佳夥伴! 總結來說,若以資料分析為志向想要選擇一種程式語言作為入門,本文建議可以從上面的分析結果當作參考,使用Python做為最主要的入門語言。

希望這篇文章能讓您在程式語言的學習之路上更有信心~

作者:許喬雅(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)

歡迎加入我們的Telegram獲取即時訊息!https://t.me/marketingdatascience
歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

您可能有興趣:

📢TMR為您量身打造「全方位數據課程」

👨‍🎓熱門Python程式語言結合全新商業思維,快來終生學習不間斷!

【TMR】 X 【 好學校】
👨‍💼Python商業全系列數位課程👨‍💼

#行銷人必學實用Python課程

《 Python 0到1 基礎商業數據分析實戰 》
💥 價格 :3188
👉 從0開始:手把手從頭學習,適合完全沒學過的學員
👉 商業應用全台最多:傳授市面上少見的Python實務應用
👉 網路輿情爬蟲演練:網路輿情商務爬蟲技法
👉 競品分析:競爭價值定位圖找出藍海策略
👉 貨架陳列視覺化:解析行銷策略及廣告預算配置方法
🛒 前往購買:https://hahow.in/cr/python0-1

《 顧客分類大師:Python x RFM 會員經營新觀點 》
💥 價格 :2388

🎯 Python X RFM最佳拍檔,輕鬆鎖定潛(錢)在顧客
不需要出門,在家也能學習專業課程,讓你擁有會員經營的新思維!

本課程以五個面向為您的企業,做更深入的健診:
👉 市場面:以最基本的顧客消費資料(頻率、購買次數),將現有顧客區隔分類。
👉 財務面:計算出在每個顧客身上所賺得毛利,在不同客群中的獲利。
👉 行銷面:藉由 RFM 的分析進行行銷預算重新分配。
👉 產品面:觀察在不同客群中,各個產品的銷售狀況。
👉 顧客回購面:分析顧客的購買週期後,進行精準推薦。
🛒 前往購買:https://hahow.in/cr/rfm-model

《 AI 行銷學:用 Python 機器學習創造商業新價值 》
💥 價格 :3888
👉 全台第一門Python機器學習線上課程
👉 教導你快速理解Logistic Regression, XGBoost, Random Forest商務機器學習模型。
👉 建構老闆或主管們看得懂的模型評估指標,讓精準行銷方案更容易被接受且推出
👉 如何利用機器學習找出消費者心中的重要變數及客樣貌與特徵,做到個體及總體的商品推薦?
👉 如何從數以萬計的消費資料中偵測可能的詐欺名單?
🛒 前往購買:https://hahow.in/cr/python-ml

#實用投資分析課程

《 用 Python 打造自己的股票小秘書 》
💥 價格 :4288
👉 打造自動推播機器人,趁著股市最近低迷,找出最適進場點
👉 「到價提醒」功能,大大提升投資便利性
👉 了解Python雲端服務架構,完整的專案流程
👉 孰悉No SQL資料庫操作,未來大數據的基礎
🛒 前往購買:https://hahow.in/cr/stock-secretary

#好學校企業百大課程之一:

台科 EMBA 年年爆滿的一門 Word 課(A系列)
💥 價格 :950
👉 系統性學習Office軟體功能,教您別人不知道的快捷鍵
👉 調整不受控制的行距與精準對齊排版
👉 一鍵轉換Word到Excel
👉 有效率處理企畫書、畢業論文、小組報告、公文等
🛒 前往購買:https://hahow.in/cr/tmr-word1

台科 EMBA 年年爆滿的一門 Word 課(B+C系列)
💥 價格 :1,050
👉 傳授獨家快捷鍵字典
👉 分享好用的大綱模式,讓文章處理更有效率
👉 建立大綱模式、多層次清單、目錄與圖表目錄,掌握文件編輯規則
👉 優化文章的邏輯架構
🛒 前往購買:https://hahow.in/cr/tmr-word2

— — — — — — — — — — — — — — — — -

【TMR】 X 【工研院】
🏭工業4.0大數據智慧應用課程🏭

《Python工業4.0人工智慧:製程資料處理大師》

製程數據資料 X 資料科學,
為您開啟工業人工智慧領域的大門!
👉全球前十大智慧製程案例實戰
👉專業講師手把手帶您入門製程資料處理分析
👉課後完整模組心法讓您通通帶回家

💥價格 : 2,800
🏃趕緊手刀前往購買:https://bit.ly/39koNbn

— — — — — — — — — — — — — — — — -

2020課程地圖

💪 點我看更多

🏆 國內第一本行銷資料科學專書

💪 點我看書本資訊

🏆 國內第一本行銷資料科學 ” 實作 ” 專書

💪 點我看書本資訊

🏆國內第一本「股票小祕書」專書

附上購書網址~ 國外的朋友也可以使用博客來與金石堂的通路轉運到國外哦!

  1. 天瓏書局:http://bit.ly/stock-secretaryBot
  2. 博客來:https://www.books.com.tw/products/0010833772

--

--

行銷資料科學

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR

More from 行銷資料科學