
只要三分鐘,立即來學習如何使用開源工具來分析資料吧
只要三分鐘,立即來學習如何使用開源工具來分析資料吧
開始來點有趣的,我們將教學該如何透過Python 一步步建立屬於自己的交易系統!但要進行交易分析前,還是需要點資料,我們先從三大法人買賣金額統計表下手。本教學將教您如何使用Python 的Requests 抓取三大法人買賣金額統計表。
繼上次教學過該如何使用Python 的 Requests 取得三大法人買賣金額統計表內容後,這次教學該如何透過 BeautifulSoup 4,使用css selector 抓取三大法人買賣的資訊!
在瞭解如何產生不同天期的資訊後,我們便可以利用這個資訊抓取多天期的三大法人交易資訊。我們只要簡單的利用def將重複地抓取動作包裝在Python 的函式中,再加上簡單的迴圈,就可以成功完成多天期的抓取!
繼上次講完該如何爬取多天三大法人統計資訊後,我們現在需要一個地方儲存這些資料。與其考量安裝、架設MySQL, PostgreSQL 等資料庫,不如來學習如何Firefox 的SQLite Manager 操作 SQLite,他簡單易用的操作方式,讓資料存放不再您的成為困擾。
知道要把資料存放到資料庫之前,我們還有一個步驟要完成,就是要清理抓取下來的資訊。但是如果碰到我們常見的金額資料,該如何把千進位所帶的逗號符號拿掉呢? 這邊教各位一個應用split 跟join 的小技巧,讓大家可以無痛的做金額轉換!
既然我們已經爬取並清理過三大法人交易金額以後,我們便可以把清理完的資訊存入資料庫之中,以便後續分析。本章即教學該如何透過Python 指令以及sqlite3 模組操作資料庫finance.sqlite,並示範如何成功將資訊存入表格之中!