如何使用Jupyter 操作 Spark?
這篇文章介紹了ISpark這個解決方案,讓使用者能夠在Ubuntu 14.04中使用Jupyter和Spark建立開發環境。這樣可以像Python一樣方便地記錄開發內容,提供了一個簡易好用的開發環境。
開始上課
這篇文章介紹了ISpark這個解決方案,讓使用者能夠在Ubuntu 14.04中使用Jupyter和Spark建立開發環境。這樣可以像Python一樣方便地記錄開發內容,提供了一個簡易好用的開發環境。
開始上課
本集延續上集的專案規劃,正式用 Claude Code 打造完整的投資回測系統「Vibe Backtest」。我們從後端 API 到前端介面一次搞定,讓你用真實數據檢驗各種投資策略。技術亮點包含:使用 UV 取代傳統 pip 進行套件管理、採用 TDD 測試驅動開發確保程式品質、透過 Plan.md 引導 Claude Code 逐步實作、FastAPI + Uvicorn 建構後端服務,以及前後端分離的現代 Web 架構。系統支援多個標的,可選擇單筆投資或定期定額策略,自動計算總報酬率、CAGR、最大回撤、波動率、夏普比率等關鍵指標,並以視覺化圖表呈現比較結果。
開始上課
文章介紹了在Python 中使用詞頻統計或字詞計數的方法來分析川普演說文中最常出現的字詞。作者提到了使用Python 的文本處理技術預處理川普演說文的內容,並使用字典資料結構記錄每個字詞的出現次數。透過迴圈和條件判斷式,可以遍歷川普演說文並計算每個字詞的出現次數,最後,可以使用Python 的排序功能將字詞按照出現次數進行排序並進行視覺化。
開始上課
光學字元辨識(OCR)能夠將紙上文字數位化,使得資訊管理變得更加方便,例如:將書籍掃描成電子版、識別及翻譯外國的路標或菜單,以及將手寫筆記快速轉化成文字檔。本文介紹如何透過 Python使用EasyOCR和PaddleOCR兩種開源工具,可以簡單地識別圖片中的文字。同時,影片中亦比較了兩個套件與不同類型文字的識別準確率。
開始上課
這篇文章介紹了如何使用Selenium來解決爬取司法院法學檢索系統的問題。由於該系統使用了Iframe來嵌入檢索結果,常常造成爬蟲無法正確獲取內容。作者建議使用Selenium IDE來自動記錄抓取步驟,並將步驟轉換為Python腳本,使得抓取過程變得更加簡單。
開始上課