[AI人工智慧] 你也能成為編曲大師!探索如何運用 AudioCraft 以文字創造音樂

  • 大數學堂
  • Aug. 6, 2023, 4:30 p.m.
[AI人工智慧] 你也能成為編曲大師!探索如何運用 AudioCraft 以文字創造音樂

現今人工智慧的進步為我們的生活帶來了前所未有的變革。你或許已熟悉使用ChatGPT創作文章、寫信、翻譯或是使用MidJourney、DALL-E以文字產生千變萬化的圖片,但今天,我們要談論的不僅僅是生文、生圖,我們要談論的是如何利用文字生成音樂!有了AudioCraft,現在你不需要專業的音樂背景,只要提供文字,AudioCraft就能為您生成旋律,音樂家可以獲取新的靈感,而中小企業主也可以輕鬆地為他們的廣告增加配樂,相信有了AudioCraft,再搭配自己的音樂品味,相信在不久的將來,大家都可以成為音樂創作大師!

開始上課

[ChatGPT] 如何使用ChatGPT 快速翻譯 PDF 文件?

  • 大數學堂
  • July 26, 2023, 9:46 a.m.
[ChatGPT] 如何使用ChatGPT 快速翻譯 PDF 文件?

【用chatgpt翻譯pdf】我們經常需要閱讀英文文件和論文,但以往將中文複製貼上到Google翻譯,往往得到一些含糊不清的翻譯結果。因此,我們現在要教大家如何使用強大的人工智慧模型 - ChatGPT快速翻譯PDF文件!

開始上課

[AI人工智慧] EasyOCR v.s. PaddleOCR 誰才是圖片轉文字(OCR)的最佳神器?!

  • 大數學堂
  • Oct. 1, 2023, 5:30 p.m.
[AI人工智慧] EasyOCR v.s. PaddleOCR 誰才是圖片轉文字(OCR)的最佳神器?!

光學字元辨識(OCR)能夠將紙上文字數位化,使得資訊管理變得更加方便,例如:將書籍掃描成電子版、識別及翻譯外國的路標或菜單,以及將手寫筆記快速轉化成文字檔。本文介紹如何透過 Python使用EasyOCR和PaddleOCR兩種開源工具,可以簡單地識別圖片中的文字。同時,影片中亦比較了兩個套件與不同類型文字的識別準確率。

開始上課

[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

  • 大數學堂
  • May 5, 2024, 10 p.m.
[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

在 [ 如何使用ChatGPT 快速翻譯 PDF 文件? ] 的影片中,我們探討了如何使用ChatGPT來翻譯文件。許多觀眾提問,表示他們有大量的論文儲存在自己的電腦或Google Drive上。因此,今天我們將展示如何有效利用我們的程式來翻譯這些文件。我們將直接從Google Drive存取文件,並使用ChatGPT進行翻譯。今天的教程不僅是對之前程式的改良,我們還將介紹一種更強大的PDF解析器。以往,我們使用了PyPDF來處理PDF文件,但由於PDF的結構複雜,我們今天將引入一個更專業的工具—LamaParse,這是由知名的RAG套件Lama Index所提供。讓我們開始今天的教程吧!

開始上課

[ChatGPT] 如何利用Meta開源的Llama2模型,打造屬於自己的ChatGPT

  • 大數學堂
  • July 23, 2023, 12:10 p.m.
[ChatGPT] 如何利用Meta開源的Llama2模型,打造屬於自己的ChatGPT

ChatGPT是一個強大的語言模型,不僅可以寫信、摘要文章、翻譯,還能協助寫程式。然而,與ChatGPT對話時也引發了擔憂,擔心機密或敏感資料可能因此外流。所幸,Meta公司推出了開源的Llama2模型,可以在本地部署並在離線環境下使用。這個模型減少了與外部服務的數據傳輸,提高了安全性。本課程介紹了在Colab上使用Llama2模型的示範,包括下載、使用transformers套件載入模型以及生成對話結果。

開始上課

[Open Jarvis] 如何使用Python寫一個翻譯蒟蒻?

  • 大數學堂
  • April 17, 2018, 3:49 p.m.
[Open Jarvis] 如何使用Python寫一個翻譯蒟蒻?

這篇文章介紹了如何使用Python和py-googletrans專案來製作一個翻譯蒟蒻。藉由Google翻譯的API,我們可以將中文翻譯成其他語言,讓與外國人的溝通變得更加容易。文章提供了相關的程式碼連結,讓讀者可以參考使用。

開始上課

[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

  • 大數學堂
  • June 3, 2024, 9:30 p.m.
[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

自從看了GPT-4o的一個發表會以後,大家是不是對多模態模型都感到非常興奮呢?雖然我們現在可以在ChatGPT Plus使用到GPT-4o,但它並沒有展示會中所展示的語音輸入和輸出功能。 幸好的是,最近Google的Gemini也推出了多模態模型,而且也可以接受語音輸入。我就想,不如把這個技術結合語音合成,打造一個即時口語翻譯系統,而且更進一步,用自己的聲音翻譯!本影片將手把手教您如何使用Google的Gemini和ElevenLabs服務,讓AI自動翻譯您講的內容,並用你自己的聲音說出翻譯後的內容,大大降低溝通門檻。

開始上課

[爬蟲實戰] 如何利用Python網路爬蟲爬取有道翻譯打造自動化翻譯系統

  • 大數學堂
  • June 30, 2022, 2:14 p.m.
[爬蟲實戰] 如何利用Python網路爬蟲爬取有道翻譯打造自動化翻譯系統

這篇文章介紹了如何使用Playwright撰寫Python網路爬蟲程式,以爬取有道翻譯的翻譯結果。透過自動化程式,可以省下許多時間和麻煩,無需重複複製貼上文字。此外,文章還宣布大數軟體正在徵求一位資深前端工程師,成功推薦人的將獲得獎金。最後,文章提供了一些相關連結,包括徵才網頁 影片 程式碼和學習資源。

開始上課