如何使用Jupyter 操作 Spark?

  • 大數學堂
  • May 31, 2015, 3:19 p.m.
如何使用Jupyter 操作 Spark?

這篇文章介紹了ISpark這個解決方案,讓使用者能夠在Ubuntu 14.04中使用Jupyter和Spark建立開發環境。這樣可以像Python一樣方便地記錄開發內容,提供了一個簡易好用的開發環境。

開始上課

[爬蟲實戰] 如何抓取某知名財報網站的資訊 ?

  • 大數學堂
  • May 30, 2015, 9:40 a.m.
[爬蟲實戰] 如何抓取某知名財報網站的資訊 ?

縱使針對網站進行多層保護,但只要爬取資料的思路正確,破解任意網站只是時間問題。就像這個知名財經網站,儘管檢查使用者是否使用爬蟲或內嵌iframe,仍無法逃脫被爬取的命運。

開始上課