大數軟體 X 大數學堂 | 搜尋關鍵字: 指令

[Selenium] 如何使用 Selenium 開啟 Chrome 瀏覽器?

大數學堂
2018年5月11日 15:09

本篇文章介紹了Selenium的基礎教程，Selenium是一種能夠進行人機互動操作的工具，可以自動打開瀏覽器瀏覽網頁，對於不擅長觀察資料連結的爬蟲開發者來說非常有用。文章提供了一段程式碼，詳細介紹了如何使用Selenium的基本指令來開啟Chrome瀏覽器並自動瀏覽網頁。具體的程式碼則可以在文章中提供的連結中找到。

開始上課

如何在三分鐘內於Ubuntu 14.04中啟用Spark-shell?

大數學堂
2015年5月30日 15:31

本地端啟用Spark非常簡單，只需要透過apt-get指令安裝Java Scala等語言，然後使用預先編譯過的Spark版本開始使用。

開始上課

[實價登錄分析] 如何使用Python Pandas 整併歷年實價登錄資訊?

大數學堂
2016年9月14日 16:29

文章中提到，僅整理一季的資料無法完整進行房價分析，因此需要將歷年的實價登錄資訊存放在不同的目錄夾中。接著，使用Pandas的Data Frame將各季的資料讀入，再使用Concat指令合併所有的Data Frame。以此，可以選擇使用describe指令獲得敘述性統計，或使用to_excel功能將資料寫入Excel檔案中。

開始上課

[Scrapy 爬蟲] 如何使用items.py整理Scrapy 爬取下來的資料並輸出成JSON檔?

大數學堂
2016年2月24日 15:26

Scrapy 的 items.py 可以將爬蟲爬取到的資料結構化，爬蟲主程式隨後可建立物件來存放爬取下來的資料。最後，透過指令 "scrapy crawl apple -o

開始上課

如何安裝Spark-Notebook 在Ubuntu?

大數學堂
2015年6月2日 16:11

本文介紹了一個優秀的專案Spark Notebook，該專案可以使用Jupyter Notebook的形式存取Spark並生成可互動的視覺化圖表。除了可以使用WISP來使用d3.js生成SVG圖檔外，還支持使用筆記本形式來進行資料分析。這將為使用者提供更多的工具來進行Spark的操作和視覺化。

開始上課

Jupyter 操作入門 (1)

大數學堂
2015年5月10日 13:14

本文介紹了在Jupyter中引入pylab進行繪圖類Linux指令觀看當前目錄的檔案執行Python程式，以及使用MathJax繪製數學方程式的方法。Jupyter是開發和維護Python程式的好工具。

開始上課

第三方套件練習題 - 運用結巴斷詞

大數學堂
2022年5月23日 00:00

結巴斷詞（jieba）是一個常用的中文中文字斷詞的Python套件。該套件可以將中文文本進行分割，分離出詞彙的單位，方便進行文本分析文字處理等自然語言處理任務。想使用結巴斷詞套件，需要先安裝並匯入該套件。以下有安裝指令和匯入代碼的示例。透過結巴斷詞可以將中文句子斷詞為詞彙的單位，方便後續的處理和分析。

開始上課

該如何使用git init 建立程式碼版本的儲存空間?

大數學堂
2015年4月21日 14:45

這篇文章介紹了如何建立程式碼的儲存庫。使用git init指令，可以設立儲存庫進行版本控制。儲存庫是用來儲存所有版本的空間。

開始上課

[交易系統] 如何透過Python 操作SQLite3?

大數學堂
2015年5月7日 16:31

本章教學了如何使用Python指令和sqlite3模組來操作finance.sqlite資料庫，並成功將清理完的資訊存入表格中。

開始上課

[ChatGPT] 個人化Llama2 ！如何在Colab中運用自己的資料集微調 Llama2 模型

大數學堂
2023年7月31日 21:00

LLaMA-Efficient-Tuning 是一個簡易的大型語言模型微調框架，能夠進行PEFT並支援訓練多種大型語言模型，如LlaMA2、BLOOM、Falcon 和 Baichuan。微調步驟包括安裝 LLaMA-Efficient-Tuning、調整 dataset_info.json 加入自己的資料集描述、導入自己的監督式微調資料集、以及使用內建指令進行監督式微調和預測生成。有了Llama2，再搭配自己的資料集，相信在不久的將來，大家都可以使用LLaMA-Efficient-Tuning快速有效地微調Llama2模型以適應特定需求。

開始上課

[爬蟲實戰] 如何使用Pandas 快速繪製日幣近期的匯率走勢?

大數學堂
2016年12月27日 17:04

本文介紹了使用Pandas進行資料分析並畫圖的簡單方法。首先使用pandas的read_csv功能讀取csv資料，然後使用%pylab inline將圖表顯示在Jupyter Notebook中，最後使用plot函式繪製折線圖。這篇文章強調了透過Pandas的幾行指令就能輕鬆完成資料分析並畫出圖表的便利性。

開始上課

hidden