OpenAI終於真正開源!GPT-OSS模型引領企業AI私有化風潮

  • 大數軟體
  • Aug. 11, 2025, 11:23 p.m.

從封閉到開放:OpenAI的轉型之路

OpenAI長期以來一直面臨著名不符實的批評,公司雖然名叫OpenAI 但缺一點都不「Open」!不過,在CEO Sam Altman公開反思並承認「站在歷史錯誤的一方」後,情況開始有了轉變。但經過多次傳聞和期待落空,就在大家幾乎要放棄希望時,OpenAI終於推出了兩款採用Mixture-of-Experts(簡稱MOE模型)架構的開源大型語言模型:gpt-oss-120B(以下簡稱OSS 120B)和gpt-oss-20BOSS 20B

這兩款模型的推出,讓開源社群終於有了可以與Gemma 3和Llama 3以外的選擇。雖然中國近期推出了不少優秀的開源模型,但許多機構因為政治考量而無法採用,GPT-OSS的出現正好填補了這個空缺。

GPT-OSS系列不負眾望,不僅成本效益出色,在推理任務的表現更是優於同級別的其他開源模型。它們具備出色的推理工具使用能力,同時支援「思路鏈」(Chain-of-Thought, CoT)推理和結構化輸出,能夠處理需要多步推理的複雜任務,並生成結構清晰的答案。

值得一提的是,OpenAI為這兩款模型進行了完整的強化學習訓練和安全微調,使其在安全性評估中的表現接近OpenAI自家的先進模型。這代表開發者在使用開源模型時,也能享有與私有模型一樣的安全標準。

 

MOE架構:繼DeepSeek之後的技術突破

雖然DeepSeek早前已經掀起了MOE架構的熱潮,但真正採用這項技術的模型仍然不多。OSS 120BOSS 20B的核心技術特色正是其Mixture-of-Experts架構。

這兩個模型的總參數量分別達到約120B20B,但得益於MOE專家混合模型的設計,每次處理輸入時只會啟用部分參數。舉例來說,OSS 120B在處理每個Token時,實際上只啟用約5.1B,OSS 20B 則只啟用約3.6B。這種架構設計讓模型在維持強大性能的同時,顯著降低了運算資源用量。

從效能表現來看,OSS 120B在多項評測中幾乎追平OpenAI較新的o4-mini模型,而OSS 20B也達到或超越了o3-mini的水準。在特定任務(如醫療問答、數學競賽題)上,OSS 120B甚至超越了部分專有模型,包括OpenAI o1和GPT-4o。

 

硬體門檻革命性降低

過去要運行大型AI模型,硬體成本高的驚人。以Llama 3 70B為例,至少需要兩張H100或L40S,硬體投資動輒兩三百萬台幣。這樣的門檻讓中小企業望而卻步。

然而根據OpenAI官方資料,OSS 120B和OSS 20B只需:

  • OSS 120B僅需單一80GB GPU即可高效運作
  • OSS 20B更只需要16GB記憶體就能在邊緣裝置上執行

也就意味著:

  • 一台配備80GB vRAM的伺服器即可運行OSS 120B
  • OSS 20B甚至可以在一般消費級硬體上運行,例如具備16GB Unified Memory的Apple M系列晶片的Mac電腦

由於OSS 120B實際運行時只啟用約5.1億參數,如果選擇H100部署,硬體成本約100萬台幣。相比之下,Mac的統一記憶體架構(Unified Memory)讓RAM可以當作VRAM使用,只需20-30萬台幣就能承載大模型。雖然在Mac上運行120B模型的速度不是最快,但因為只需啟用5.1B參數,實際表現相當理想。

 

資料隱私與自主控制

開源權重模型帶來的另一個重要優勢是資料隱私與自主控制。企業可以將OSS 120B/20B下載並部署在自己的內網或地端設備上,模型權重完全掌握在自家,不需將敏感數據傳輸到第三方雲端。

企業和公部門可以將這些模型進行內部部署以確保資料安全,或針對專門領域數據進行微調。對於重視資料安全的金融、醫療和政府單位,能自主掌控AI非常重要。

 

QubicX:企業AI轉型的一站式解決方案

QubicX:企業AI轉型的一站式解決方案

那OpenAI的OSS模型問世後,企業如何充分利用其優勢來加速AI轉型?大數軟體推出的QubicX平台提供了完整的解決方案,該平台可搭載Mac或NVIDIA DGX Spark等硬體。

QubicX是一個整合了OSS 120B/20B及其他開源模型的AI應用平台,將先進的語言模型能力與企業實際需求緊密結合,提供一系列高效實用的AI服務功能。透過QubicX,企業決策者與AI開發者可以更輕鬆地將這些開源模型應用到業務場景中,無需從零開始建構AI基礎設施,而且價格相當實惠。

AI對話引擎:智慧客服與AI助理系統

AI 助理

QubicX的AI對話引擎充分利用OSS模型強大的自然語言理解與生成能力,打造類似ChatGPT的智能對話體驗。企業可以藉此快速部署聊天機器人或智能助理,與使用者進行流暢的多輪對話。

由於OSS 120B/20B具備優異的上下文理解和推理能力,QUBICX對話引擎能夠準確理解客戶提問並給出適切的回應,甚至在複雜問題上進行深入的追問與推理。

實際應用場景:

  • 客服自動化:建立24/7在線的智慧客服系統
  • 內部員工助理:即時回答員工疑問

QUBICX還能結合OSS模型的工具使用能力(如調用MCP協議、資料庫查詢),為使用者提供更全面、更有價值的回答,真正實現企業知識的智慧化服務。

文件與知識管理(RAG助理)

RAG 檢索增強生成

QubicX平台內建RAG(Retrieval-Augmented Generation,檢索增強生成)助理,可以建立企業的智慧知識庫系統。

透過RAG技術,QubicX能將企業內部的大量文件、知識庫資料與OSS模型結合,讓模型在回答問題時檢索相關資訊並加以引用。這意味著使用者向AI提問時,系統不僅依賴模型訓練時學到的知識,還會即時從企業自己的文件資料中找到最新、最相關的內容。

重要的是,這過程不需重新訓練模型,即可將LLM的能力擴展到組織內部的知識上,大幅提升生成結果的相關性與精確度。

實際應用效益:

  • 企業可以將各種文件資料(如產品手冊、內部Wiki、報告檔案、客戶Q&A記錄、報價單等)輸入QubicX
  • 員工或客戶只需以自然語言提問,系統就會檢索相關文件片段並生成答案,同時提供引用來源
  • 研發團隊可用來整合技術文件,快速找到解決方案
  • 新進人員可將其作為知識導覽工具,大幅縮短培訓時間

OCR與語音轉文字:跨媒體資料處理能力

QubicX整合了OCR(光學字元辨識)ASR語音轉文字能力,協助企業將非結構化資料轉化為可由AI理解的文字內容。

OCR圖片轉文字功能:將掃描的文件、合約、發票、出貨單等圖像檔轉換成文字

ASR語音轉文字功能:將會議錄音、電話通話、語音備忘錄等音訊資料自動轉寫為文字記錄

ASR語音轉文字功能

這些轉換後的文字內容可以無縫融入RAG知識庫或對話引擎中,擴充AI可存取的資訊範圍。

實際應用案例:

  • 客服中心的通話錄音轉文字後,可分析常見客訴問題並增進AI答覆品質
  • 法務部門將紙本合約數位化,進行條款檢索或風險提示

這些技術皆可在本地執行,結合本地部署優勢,確保機敏資料的安全性。

自動合約擬定與智慧寫文:提升法務與文書效率

QubicX提供的自動合約擬定智慧寫文功能,利用OSS模型的強大生成能力,能夠顯著提升文書工作的效率和品質。

自動合約擬定:

法務人員或業務主管只需輸入關鍵條件與要求,系統就能根據內建的範本和行業最佳實踐,自動生成合約初稿。這項功能涵蓋常見的合約類型,如保密協議、服務條款等。

自動合約擬定

智慧寫文功能的廣泛應用:

  • 人資部門:自動撰寫標準化的聘雇合約或人事通知
  • 行銷團隊:AI協助起草市場活動文案、新聞稿、社群貼文
  • 管理層:撰寫週報、會議記錄或商業提案的初稿
  • 公務機關:透過AI 撰寫公文、新聞稿

智慧寫文

AI生成內容還可以結合RAG功能,引用企業內部數據或文件內容,確保內容的真實性和可靠性。

企業AI時代已經來臨

隨著OpenAI OSS 120B/20B這類強大開源模型的出現,以及QubicX這樣的整合平台將其應用落地,我們正式進入了企業AI私有化的新時代。

過去困擾企業的高昂成本和技術門檻正在快速下降:MOE模型帶來的低硬體需求與高效能,使得先進的AI能力不再是大型企業的專利。透過QubicX,企業無需耗費數月自行整合各種AI工具,就能立即獲得全方位的AI應用方案。

有了像OSS 120B/20B這樣性能卓越且開放的模型,再加上QubicX平台的完整支援,各領域的企業都可以積極嘗試將AI融入核心業務,找到最適合自己的切入點。