[分類實戰] 如何使用Spark 預測客戶是否流失(Part 1)?

  • 大數學堂
  • 2015年6月15日 15:53
[分類實戰] 如何使用Spark 預測客戶是否流失(Part 1)?

這篇文章介紹了如何使用Spark進行機器學習。只要將資料整理成特徵和標籤的格式,就能夠使用MLlib提供的演算法進行快速分類。這樣的分類技術不僅能夠選出土豆,還能夠預測電信業客戶是否流失。然而,在進行分類之前,我們需要對資料進行整理,以使其符合分類演算法的要求。

開始上課

[爬蟲實戰] 如何在1111購物狂歡節 快速爬取淘寶上的商品資訊?

  • 大數學堂
  • 2019年10月30日 13:39
[爬蟲實戰] 如何在1111購物狂歡節 快速爬取淘寶上的商品資訊?

這篇文章介紹了如何快速寫一個淘寶爬蟲程式。現在的電商網頁都有提供API,可以方便地將商品資訊下載下來。只要透過Chrome的開發人員工具找到API的端口,然後使用requests將JSON格式資料爬取下來。再搭配Pandas的資料整理功能,就可以將商品資訊整理成表格,方便閱覽和分析。文章最後提供了相關影片和程式碼的連結。

開始上課