另外補充,本篇作者建議如果讀者是常在NLP領域的資料科學家,建議可以在Python方面更加精進,因為Python不管在資料前處理或者用到更深的Word2vec模型等,都具充足且完整的體系,舉例來說:TFIDF或BOW我們在簡單的sklearn中就可以找到,regression or classification類別模型,也都可以從sklearn中下手,讓使用者建模來說非常方便。
更進階的如Pytorch, tensorflow等,皆完整支持NLP建模,使用上也非常平易近人,更遑論建模彈性,再者,如果要將建模結果應用在軟體或服務上,使用python做prototype或服務佈署上,都相應更有彈性。