[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 2)?

  • 大數學堂
  • 2015年11月25日 13:53

繼取得Facebook 2015 年所有的貼文內容後,接下來我們可以將貼文進行斷詞,並取得詞頻。

對於英文資料而言,斷詞只須根據空白斷句即可,但中文便必須仰賴好的分詞工具,這邊大家可以學習使用Python 套件jieba,便可以順利將貼文分詞,於排序過後,便可以取得Facebook 貼文中最常使用的詞頻。