學術界對大數據的新看法

行銷資料科學
4 min readOct 25, 2019

--

使用大數據來預測實務世界裡的現象,需要「理論」來支持嗎?以往可能有人說不必,但是澤基‧西姆塞克(Zeki Simsek)等學者,最近在頂級的管理學期刊Academy of Management Journal主編的話(From the Editors)專欄中,提出對大數據的新看法(New Ways of Seeing Big Data)。他們認為,如果沒有「理論」,大數據方法通常無法對其應用的管理現象進行解釋,同時大數據也不能替代嚴謹的研究設計。

建構理論一直是學術界做研究時追求的目標。過去幾年,大數據研究盛行,因為在資料驅動(data driven)的世界裡,整理、分析資料,並從中建立預測模型,成為學界的新潮流。但這股風潮對於建構理論卻不那麼重視。澤基‧西姆塞克等人最近觀察到,關於大數據研究的觀點,主要有以下三類特徵:一、研究從小數據到大數據,以達到資料驅動(data driven)的目的;其次,研究則從強調「因果關係」到探究資料背後的模式與相關性;三,研究也從驗證理論到從資料中發現新見解,如圖1所示。

圖1 大數據研究的觀點(繪圖者:曾琦心)

西姆塞克等人認為,這些特徵看似合理,但真正重要的是大數據背後的「大數法則」,因為在具有足夠的資料與樣本的狀況下,錯誤(與不確定性)必然會降低。此外,運用大數據分析所獲得合理結論的意義,遠大於大數據本身的特徵(數量Volume、速度Velocity或類型Variety…等)。因此,關於大數據的研究,真正的問題不在於大數據本身,而是思考、蒐集、調查大數據的方式。

不過,話說回來,西姆塞克等人提醒,如果沒有「理論」來支撐,大數據方法通常無法提供對其應用的「管理現象」加以解釋,甚至無法類推。大數據也不能取代嚴謹的研究設計,以及對研究問題的適當考量。

他們因此鼓勵研究人員,除了強調資料蒐集、儲存、整合、分析、報告、以及視覺化的邏輯,並應此以擬定和傳達其大數據研究的研究設計之外,因為如果資料的建立、操弄、分析的過程透明度很低,其他研究者將難以「重現」與延續該研究,也有違科學方法傳承的目標。西姆塞克等人建議,有關研究設計,在運用大數據之前,可先用小樣本確定效度,或是結合其他研究方法,以確定效度和闡明研究過程。

他們並提醒,大數據研究中,將「資料」轉換為「構念」和「變數」的過程常常缺乏透明度,可能沒有明確的理論推導。因此,必須有效說服其他研究者(通常是審稿者與讀者),從大數據中發現的相關模式是合理的,而非僅僅是「偶然」的關聯。無論研究者是使用何種分析技術,都應清楚描述各種變數與各變數的關聯過程,而不是將它們掩埋在「黑盒子」中。更重要的是,研究者有義務證明其所使用之工具和技術的合理性。

最後,西姆塞克等人提到,雖然大數據研究有其應該強化之處,但對於理論測試,大數據研究方法與統計推論方式同樣有效,甚至更好。同時,在運用視覺化方式演示研究結果,大數據研究具有非常大的優勢。

資料來源

Simsek, Zeki, Eero Vaara, Srikanth Paruchuri, Sucheta Nadkarni and Jason D. Shaw (2019), “From the Editors: New Ways of Seeing Big Data,” Academy of Management Journal, 62 (4), 971–978.

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

繪圖者: 曾琦心(臺灣行銷研究特約設計師)

歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

您可能有興趣:

--

--

行銷資料科學
行銷資料科學

Written by 行銷資料科學

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR

No responses yet