[AI人工智慧] 你也能成為編曲大師!探索如何運用 AudioCraft 以文字創造音樂

  • 大數學堂
  • Aug. 6, 2023, 4:30 p.m.
[AI人工智慧] 你也能成為編曲大師!探索如何運用 AudioCraft 以文字創造音樂

現今人工智慧的進步為我們的生活帶來了前所未有的變革。你或許已熟悉使用ChatGPT創作文章、寫信、翻譯或是使用MidJourney、DALL-E以文字產生千變萬化的圖片,但今天,我們要談論的不僅僅是生文、生圖,我們要談論的是如何利用文字生成音樂!有了AudioCraft,現在你不需要專業的音樂背景,只要提供文字,AudioCraft就能為您生成旋律,音樂家可以獲取新的靈感,而中小企業主也可以輕鬆地為他們的廣告增加配樂,相信有了AudioCraft,再搭配自己的音樂品味,相信在不久的將來,大家都可以成為音樂創作大師!

開始上課

[ChatGPT] 用說的也會通!如何用語音與ChatGPT 對話

  • 大數學堂
  • Jan. 15, 2023, 7:50 a.m.
[ChatGPT] 用說的也會通!如何用語音與ChatGPT 對話

本文介紹了如何使用revChatGPT接出ChatGPT API並透過Python的SpeechRecognition與gTTS,創造一個能夠透過語音與ChatGPT對話的介面。這個方法讓使用者能夠與ChatGPT進行真正的對談,不僅限於使用官方介面或GPT3 API。文章提供了相關的影片和程式碼連結,並引用了其他與語音文字轉換相關的資源。整體而言,該方法能夠讓使用者在無人陪伴的時刻找到一個人工智慧好夥伴與之對話。

開始上課

Colab 操作與簡介

  • 大數學堂
  • May 23, 2022, midnight
Colab 操作與簡介

Colab是由Google提供的基於瀏覽器的Python環境,旨在為數據科學家和機器學習研究者提供便利。使用者可以在雲端一鍵執行Python程式碼,無需安裝任何軟體或配置硬體。Colab支援Python 2和Python 3,內建許多熱門的Python庫。同時,Colab也支援GPU和TPU加速,可以提高運算速度。操控Colab非常容易,只需登錄Google帳戶,即可使用Google Drive儲存和管理代碼和數據,還能創建 編輯和共享Colab筆記本。

開始上課

[ChatGPT] Whisper還是剪映?選擇最佳字幕創建工具讓你的影片更專業!

  • 大數學堂
  • March 12, 2023, 8:31 a.m.
[ChatGPT] Whisper還是剪映?選擇最佳字幕創建工具讓你的影片更專業!

這篇文章提到隨著YouTube影片的普及,語音轉文字的需求也相應增加。文章介紹了如何使用Python調用Whisper API將YouTube影片轉錄成字幕,並利用Pysrt合併和修改字幕時間。同時還比較了這種轉錄方式與剪映的差異。影片和程式碼也提供了相關連結,以便讀者更深入了解。該文章還以標籤形式列出了相關的主題,如語音識別 YouTube字幕生成等,方便讀者查找相關資訊。

開始上課

[AI人工智慧] EasyOCR v.s. PaddleOCR 誰才是圖片轉文字(OCR)的最佳神器?!

  • 大數學堂
  • Oct. 1, 2023, 5:30 p.m.
[AI人工智慧] EasyOCR v.s. PaddleOCR 誰才是圖片轉文字(OCR)的最佳神器?!

光學字元辨識(OCR)能夠將紙上文字數位化,使得資訊管理變得更加方便,例如:將書籍掃描成電子版、識別及翻譯外國的路標或菜單,以及將手寫筆記快速轉化成文字檔。本文介紹如何透過 Python使用EasyOCR和PaddleOCR兩種開源工具,可以簡單地識別圖片中的文字。同時,影片中亦比較了兩個套件與不同類型文字的識別準確率。

開始上課

[深度學習] 如何使用 DeepFakes 技術移花接木影片人物的臉(三)?

  • 大數學堂
  • March 16, 2020, 2:51 p.m.
[深度學習] 如何使用 DeepFakes 技術移花接木影片人物的臉(三)?

DeepFakes技術利用DeepFaceLab程式碼將鋼鐵人的臉放到作者的臉上。這個技術使得製作高度逼真的偽造影片變得非常容易。作者使用Google Colab的免費提供的GPU來加速深度模型的訓練和實施。詳細程式碼和相關資源已提供。 #DeepFakes #DeepFaceLab #DeepLearning #深度偽造 #鋼鐵人

開始上課

[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

  • 大數學堂
  • May 5, 2024, 10 p.m.
[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

在 [ 如何使用ChatGPT 快速翻譯 PDF 文件? ] 的影片中,我們探討了如何使用ChatGPT來翻譯文件。許多觀眾提問,表示他們有大量的論文儲存在自己的電腦或Google Drive上。因此,今天我們將展示如何有效利用我們的程式來翻譯這些文件。我們將直接從Google Drive存取文件,並使用ChatGPT進行翻譯。今天的教程不僅是對之前程式的改良,我們還將介紹一種更強大的PDF解析器。以往,我們使用了PyPDF來處理PDF文件,但由於PDF的結構複雜,我們今天將引入一個更專業的工具—LamaParse,這是由知名的RAG套件Lama Index所提供。讓我們開始今天的教程吧!

開始上課

[深度學習] 如何使用 YOLO 製作即時口罩檢測系統(一) - YOLO簡介?

  • 大數學堂
  • April 13, 2020, 3:37 p.m.
[深度學習] 如何使用 YOLO 製作即時口罩檢測系統(一) - YOLO簡介?

為了減少檢測人力,作者介紹了一個口罩檢測系統的建構方法,使用YOLO (You only look once)來快速檢測是否每個人都有配戴口罩。文章提到了YOLO的介紹以及在Colab上安裝YOLO的步驟。作者也提供了相關的教學影片和程式碼連結。這個系統有助於確保大家的健康,尤其在新冠肺炎持續延燒的情況下。

開始上課

[ChatGPT] 如何利用Meta開源的Llama2模型,打造屬於自己的ChatGPT

  • 大數學堂
  • July 23, 2023, 12:10 p.m.
[ChatGPT] 如何利用Meta開源的Llama2模型,打造屬於自己的ChatGPT

ChatGPT是一個強大的語言模型,不僅可以寫信、摘要文章、翻譯,還能協助寫程式。然而,與ChatGPT對話時也引發了擔憂,擔心機密或敏感資料可能因此外流。所幸,Meta公司推出了開源的Llama2模型,可以在本地部署並在離線環境下使用。這個模型減少了與外部服務的數據傳輸,提高了安全性。本課程介紹了在Colab上使用Llama2模型的示範,包括下載、使用transformers套件載入模型以及生成對話結果。

開始上課

[ChatGPT] 個人化Llama2 !如何在Colab中運用自己的資料集微調 Llama2 模型

  • 大數學堂
  • July 31, 2023, 9 p.m.
[ChatGPT] 個人化Llama2 !如何在Colab中運用自己的資料集微調 Llama2 模型

LLaMA-Efficient-Tuning 是一個簡易的大型語言模型微調框架,能夠進行PEFT並支援訓練多種大型語言模型,如LlaMA2、BLOOM、Falcon 和 Baichuan。微調步驟包括安裝 LLaMA-Efficient-Tuning、調整 dataset_info.json 加入自己的資料集描述、導入自己的監督式微調資料集、以及使用內建指令進行監督式微調和預測生成。有了Llama2,再搭配自己的資料集,相信在不久的將來,大家都可以使用LLaMA-Efficient-Tuning快速有效地微調Llama2模型以適應特定需求。

開始上課

[財經爬蟲]手把手帶你用Python網路爬蟲抓取Goodinfo,再結合GPT-4o快速分析潛力股!

  • 大數學堂
  • June 16, 2024, 9 p.m.
[財經爬蟲]手把手帶你用Python網路爬蟲抓取Goodinfo,再結合GPT-4o快速分析潛力股!

本教學將手把手教學如何從GoodInfo網站獲取臺積電財報數據外,還將進一步利用ChatGPT的GPT-4 API解讀財報,判斷公司是否值得投資。影片內容涵蓋了爬蟲、資料處理、API註冊、提示詞設計、財報分析等詳細步驟,幫助您掌握快速取得股票財報和AI輔助投資決策的方法。

開始上課

[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

  • 大數學堂
  • June 3, 2024, 9:30 p.m.
[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

自從看了GPT-4o的一個發表會以後,大家是不是對多模態模型都感到非常興奮呢?雖然我們現在可以在ChatGPT Plus使用到GPT-4o,但它並沒有展示會中所展示的語音輸入和輸出功能。 幸好的是,最近Google的Gemini也推出了多模態模型,而且也可以接受語音輸入。我就想,不如把這個技術結合語音合成,打造一個即時口語翻譯系統,而且更進一步,用自己的聲音翻譯!本影片將手把手教您如何使用Google的Gemini和ElevenLabs服務,讓AI自動翻譯您講的內容,並用你自己的聲音說出翻譯後的內容,大大降低溝通門檻。

開始上課