[爬蟲實戰] 如何擷取網頁中的隱藏輸入以順利下載證交所的 csv 檔?

  • 大數學堂
  • 2015年9月20日 17:05

爬蟲除了可以直接擷取網頁上的資訊外,也可以用來下載 csv 檔。

但看到證交所將網頁內容以 base64 的編碼放置在 post 的參數中時,著實也被這匪夷所思的寫法嚇了一跳。

所幸我們可以直接抓取網頁中的隱藏輸入,再將資料做 base64 編碼,這時我們便可順利的將 csv 抓取下來了!