[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 3)?
這篇文章探討如何使用Tableau Public快速而簡單地繪製文字雲。比起使用複雜的d3.js,Tableau Public的介面更容易上手。文字雲可以幫助人們一目了然地看到在臉書上最常使用的文字頻率,這對於做社群分析或個人使用都十分有用。
開始上課這篇文章探討如何使用Tableau Public快速而簡單地繪製文字雲。比起使用複雜的d3.js,Tableau Public的介面更容易上手。文字雲可以幫助人們一目了然地看到在臉書上最常使用的文字頻率,這對於做社群分析或個人使用都十分有用。
開始上課為了獲得Facebook貼文的詞頻,我們需要對貼文進行斷詞,對於英文資料,只需要根據空格斷句即可,但中文需要依賴分詞工具。我們可以使用Python套件jieba來進行分詞,然後排序,就能獲得Facebook貼文中最常使用的詞頻。
開始上課文章介紹了最近vonvon的人氣臉書文字分析服務,並提供了使用網路爬蟲(Python Crawler)來抓取用戶在Facebook上留下的所有訊息內容的教程。
開始上課這篇文章介紹了如何使用Python網路爬蟲來抓取雙十一購物狂歡節活動網頁中的商品列表。雖然淘寶的網頁改版後讓資料抓取變得困難,但這不會阻止我們追求購物資訊的熱情。文章將教你如何使用Python網路爬蟲來解決這個問題。
開始上課這堂免費課指出,不一定需要使用OpenCV來辨識文字,可以使用之前的HTTP請求Session和圖片顯示功能來半自動地抓取有驗證碼限制的網頁內容。這種方法讓抓取網頁資料變得容易又輕鬆。
開始上課