[財經爬蟲] 如何使用正規表達法快速抓取所有上市公司代號?
這篇文章介紹如何使用Python網路爬蟲抓取GoodInfo的所有上市公司基本資訊。作者首先透過Tej的網站找到上市上櫃公司的代碼清單,接著使用正規表達法快速抽取出所有的數字代碼,以獲得所有上市公司的代碼。文章中還提供了影片和程式碼的連結。
開始上課這篇文章介紹如何使用Python網路爬蟲抓取GoodInfo的所有上市公司基本資訊。作者首先透過Tej的網站找到上市上櫃公司的代碼清單,接著使用正規表達法快速抽取出所有的數字代碼,以獲得所有上市公司的代碼。文章中還提供了影片和程式碼的連結。
開始上課這篇文章介紹了利用Python網路爬蟲抓取一些會鎖IP的網站時,需要使用免費的Proxy來規避被封鎖的風險。文章提到了抓取Free Proxy List上的頁面,利用正規表達式蒐集IP清單,再利用ipify進行測試,重複操作便能建立自己的Python網路爬蟲跳板清單。文章中還提供了相關影片和程式碼連結。
開始上課Goodinfo台灣股市資訊網為投資者提供重要股票資訊,作者使用Python網路爬蟲自動化爬取各股票的歷年經營績效。作者通過設定user-agent以規避Goodinfo的防爬蟲機制,並使用Pandas整理資料。這樣的資料結構可以幫助投資者做出更好的投資決策。詳細的影片和程式碼連結都有提供。
開始上課證交所公佈了上市與上櫃公司非擔任主管職務的全時員工薪資資訊,介紹了使用Python的requests和pandas來爬取和分析這些公司的薪資水平。以往只提供薪資平均值,而今年則加入了中位數的資訊,以更客觀地反映薪資水平。影片和程式碼連結也提供在文章中。
開始上課YOLOv4 以比 EfficientDet 更快的速度和相等的效果出現了,對人們來說相當吸引人。這篇文章給出了在 Google Colab 上安裝並調用 YOLOv4
開始上課