什麼是網路爬蟲?

  • 大數學堂
  • April 10, 2015, 5:49 a.m.
什麼是網路爬蟲?

爬蟲是一種利用HTTP Request 抓取網路資料的技術,可以用來建立比價網站或進行資料分析。當你需要資料但又無法與他人交換或合作時,爬蟲技術可以將他人的資料庫變成自己的資料庫。這種技術擁有很大的應用價值。

開始上課

開始使用Python撰寫網路爬蟲 ( Crawler )

  • 大數學堂
  • April 15, 2015, 12:49 a.m.
開始使用Python撰寫網路爬蟲 ( Crawler )

這篇文章介紹了使用Python編寫網路爬蟲的開始步驟,其中需要安裝兩個Python套件:Requests和BeautifulSoup4。Requests是一個用於網路資源擷取的套件,而BeautifulSoup4則是一個用於HTML剖析的套件。

開始上課

如何安裝 Jupyter (Ipython Notebook)

  • 大數學堂
  • May 7, 2015, 7:04 a.m.
如何安裝 Jupyter (Ipython Notebook)

Jupyter是一個強大而方便的工具,它提供網頁介面,讓使用者可以使用瀏覽器進行Julia Python或R程式的開發和維護。這個工具相當實用,值得一試。未來我們將陸續介紹它的各種好用功能。

開始上課

Jupyter 操作入門 (1)

  • 大數學堂
  • May 10, 2015, 1:14 p.m.
Jupyter 操作入門 (1)

本文介紹了在Jupyter中引入pylab進行繪圖 類Linux指令觀看當前目錄的檔案 執行Python程式,以及使用MathJax繪製數學方程式的方法。Jupyter是開發和維護Python程式的好工具。

開始上課

如何使用GET 抓取網頁內容?

  • 大數學堂
  • April 16, 2015, 3:15 p.m.
如何使用GET 抓取網頁內容?

這篇文章介紹了如何使用Python編寫三行程式碼來抓取淘寶網的網頁內容。並且提供了一個範例網頁連結供讀者參考。

開始上課

如何使用POST 抓取網頁內容?

  • 大數學堂
  • April 19, 2015, 9:29 a.m.
如何使用POST 抓取網頁內容?

本文章介紹了如何使用POST方法在Python中抓取高鐵網頁內容。使用POST方法可以將請求資訊包裝起來,再傳送至伺服器以取得回應資訊。在Python中使用POST方法非常簡單,只需將請求資訊以字典做包裝即可。

開始上課

如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?

  • 大數學堂
  • April 18, 2015, 1:59 a.m.
如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?

這篇文章介紹如何使用Python的requests和BeautifulSoup4來完成淘寶網站的爬蟲。作者提到,既然已經了解了如何使用requests抓取網頁內容,並使用BeautifulSoup4來解析有用的資訊,接下來將進入實戰階段,示範如何完成淘寶爬蟲。

開始上課