OpenAI終於真正開源！GPT-OSS模型引領企業AI私有化風潮

大數軟體
Aug. 11, 2025, 11:23 p.m.

快速摘要

GPT-OSS是OpenAI於二零二五年推出的首批真正開源大型語言模型，包含gpt-oss-120B與gpt-oss-20B兩款，均採用MoE（Mixture-of-Experts，專家混合）架構。兩款模型雖總參數量分別達一百二十億與二十億，但實際推理時分別只啟用五點一億與三點六億參數，大幅降低運算資源需求。硬體門檻方面，OSS 120B只需單一八十GB GPU即可高效運行，OSS 20B甚至可在具備十六GB統一記憶體的Apple M系列Mac上執行，部署成本從過去兩三百萬台幣降至二三十萬元。效能方面，OSS 120B幾乎追平OpenAI o4-mini，在醫療問答、數學競賽等特定任務甚至超越GPT-4o。模型完成安全微調與對齊訓練後以開源授權釋出，企業可將模型部署於自家內網，確保敏感資料完全不外傳。大數軟體QubicX平台已整合OSS系列模型，提供AI對話引擎、RAG知識庫、OCR文件識別、ASR語音轉文字及智慧合約擬定等一站式企業AI服務，特別適合金融、醫療、政府等重視資料安全的機構導入使用。

從封閉到開放：OpenAI的轉型之路

OpenAI長期以來一直面臨著名不符實的批評，公司雖然名叫OpenAI 但缺一點都不「Open」！不過，在CEO Sam Altman公開反思並承認「站在歷史錯誤的一方」後，情況開始有了轉變。但經過多次傳聞和期待落空，就在大家幾乎要放棄希望時，OpenAI終於推出了兩款採用Mixture-of-Experts（簡稱MOE模型）架構的開源大型語言模型：gpt-oss-120B（以下簡稱OSS 120B）和gpt-oss-20B（OSS 20B）。

這兩款模型的推出，讓開源社群終於有了可以與Gemma 3和Llama 3以外的選擇。雖然中國近期推出了不少優秀的開源模型，但許多機構因為政治考量而無法採用，GPT-OSS的出現正好填補了這個空缺。

GPT-OSS系列不負眾望，不僅成本效益出色，在推理任務的表現更是優於同級別的其他開源模型。它們具備出色的推理與工具使用能力，同時支援「思路鏈」（Chain-of-Thought, CoT）推理和結構化輸出，能夠處理需要多步推理的複雜任務，並生成結構清晰的答案。

值得一提的是，OpenAI為這兩款模型進行了完整的強化學習訓練和安全微調，使其在安全性評估中的表現接近OpenAI自家的先進模型。這代表開發者在使用開源模型時，也能享有與私有模型一樣的安全標準。

MOE架構：繼DeepSeek之後的技術突破

雖然DeepSeek早前已經掀起了MOE架構的熱潮，但真正採用這項技術的模型仍然不多。OSS 120B與OSS 20B的核心技術特色正是其Mixture-of-Experts架構。

這兩個模型的總參數量分別達到約120B和20B，但得益於MOE專家混合模型的設計，每次處理輸入時只會啟用部分參數。舉例來說，OSS 120B在處理每個Token時，實際上只啟用約5.1B，OSS 20B 則只啟用約3.6B。這種架構設計讓模型在維持強大性能的同時，顯著降低了運算資源用量。

從效能表現來看，OSS 120B在多項評測中幾乎追平OpenAI較新的o4-mini模型，而OSS 20B也達到或超越了o3-mini的水準（來源：OpenAI模型卡）。在特定任務（如醫療問答、數學競賽題）上，OSS 120B甚至超越了部分專有模型，包括OpenAI o1和GPT-4o。

硬體門檻革命性降低

過去要運行大型AI模型，硬體成本高的驚人。以Llama 3 70B為例，至少需要兩張H100或L40S，硬體投資動輒兩三百萬台幣。這樣的門檻讓中小企業望而卻步。

然而根據OpenAI官方資料，OSS 120B和OSS 20B只需：

OSS 120B僅需單一80GB GPU即可高效運作
OSS 20B更只需要16GB記憶體就能在邊緣裝置上執行

也就意味著：

一台配備80GB vRAM的伺服器即可運行OSS 120B
OSS 20B甚至可以在一般消費級硬體上運行，例如具備16GB Unified Memory的Apple M系列晶片的Mac電腦

由於OSS 120B實際運行時只啟用約5.1億參數，如果選擇H100部署，硬體成本約100萬台幣。相比之下，Mac的統一記憶體架構（Unified Memory）讓RAM可以當作VRAM使用，只需20-30萬台幣就能承載大模型。雖然在Mac上運行120B模型的速度不是最快，但因為只需啟用5.1B參數，實際表現相當理想。

資料隱私與自主控制

開源權重模型帶來的另一個重要優勢是資料隱私與自主控制。企業可以將OSS 120B/20B下載並部署在自己的內網或地端設備上，模型權重完全掌握在自家，不需將敏感數據傳輸到第三方雲端。

企業和公部門可以將這些模型進行內部部署以確保資料安全，或針對專門領域數據進行微調。對於重視資料安全的金融、醫療和政府單位，能自主掌控AI非常重要。

QubicX：企業AI轉型的一站式解決方案

那OpenAI的OSS模型問世後，企業如何充分利用其優勢來加速AI轉型？大數軟體推出的QubicX平台提供了完整的解決方案，該平台可搭載Mac或NVIDIA DGX Spark等硬體。

QubicX是一個整合了OSS 120B/20B及其他開源模型的AI應用平台，將先進的語言模型能力與企業實際需求緊密結合，提供一系列高效實用的AI服務功能。透過QubicX，企業決策者與AI開發者可以更輕鬆地將這些開源模型應用到業務場景中，無需從零開始建構AI基礎設施，而且價格相當實惠。

AI對話引擎：智慧客服與AI助理系統

AI 助理

QubicX的AI對話引擎充分利用OSS模型強大的自然語言理解與生成能力，打造類似ChatGPT的智能對話體驗。企業可以藉此快速部署聊天機器人或智能助理，與使用者進行流暢的多輪對話。

由於OSS 120B/20B具備優異的上下文理解和推理能力，QUBICX對話引擎能夠準確理解客戶提問並給出適切的回應，甚至在複雜問題上進行深入的追問與推理。

實際應用場景：

客服自動化：建立24/7在線的智慧客服系統
內部員工助理：即時回答員工疑問

QUBICX還能結合OSS模型的工具使用能力（如調用MCP協議、資料庫查詢），為使用者提供更全面、更有價值的回答，真正實現企業知識的智慧化服務。

文件與知識管理（RAG助理）

RAG 檢索增強生成

QubicX平台內建RAG（Retrieval-Augmented Generation，檢索增強生成）助理，可以建立企業的智慧知識庫系統。

透過RAG技術，QubicX能將企業內部的大量文件、知識庫資料與OSS模型結合，讓模型在回答問題時檢索相關資訊並加以引用。這意味著使用者向AI提問時，系統不僅依賴模型訓練時學到的知識，還會即時從企業自己的文件資料中找到最新、最相關的內容。

重要的是，這過程不需重新訓練模型，即可將LLM的能力擴展到組織內部的知識上，大幅提升生成結果的相關性與精確度。

實際應用效益：

企業可以將各種文件資料（如產品手冊、內部Wiki、報告檔案、客戶Q&A記錄、報價單等）輸入QubicX
員工或客戶只需以自然語言提問，系統就會檢索相關文件片段並生成答案，同時提供引用來源
研發團隊可用來整合技術文件，快速找到解決方案
新進人員可將其作為知識導覽工具，大幅縮短培訓時間

OCR與語音轉文字：跨媒體資料處理能力

QubicX整合了OCR（光學字元辨識）與ASR語音轉文字能力，協助企業將非結構化資料轉化為可由AI理解的文字內容。

OCR圖片轉文字功能：將掃描的文件、合約、發票、出貨單等圖像檔轉換成文字

ASR語音轉文字功能：將會議錄音、電話通話、語音備忘錄等音訊資料自動轉寫為文字記錄

ASR語音轉文字功能

這些轉換後的文字內容可以無縫融入RAG知識庫或對話引擎中，擴充AI可存取的資訊範圍。

實際應用案例：

客服中心的通話錄音轉文字後，可分析常見客訴問題並增進AI答覆品質
法務部門將紙本合約數位化，進行條款檢索或風險提示

這些技術皆可在本地執行，結合本地部署優勢，確保機敏資料的安全性。

自動合約擬定與智慧寫文：提升法務與文書效率

QubicX提供的自動合約擬定與智慧寫文功能，利用OSS模型的強大生成能力，能夠顯著提升文書工作的效率和品質。

自動合約擬定：

法務人員或業務主管只需輸入關鍵條件與要求，系統就能根據內建的範本和行業最佳實踐，自動生成合約初稿。這項功能涵蓋常見的合約類型，如保密協議、服務條款等。

自動合約擬定

智慧寫文功能的廣泛應用：

人資部門：自動撰寫標準化的聘雇合約或人事通知
行銷團隊：AI協助起草市場活動文案、新聞稿、社群貼文
管理層：撰寫週報、會議記錄或商業提案的初稿
公務機關：透過AI 撰寫公文、新聞稿

智慧寫文

AI生成內容還可以結合RAG功能，引用企業內部數據或文件內容，確保內容的真實性和可靠性。

企業AI時代已經來臨

隨著OpenAI OSS 120B/20B這類強大開源模型的出現，以及QubicX這樣的整合平台將其應用落地，我們正式進入了企業AI私有化的新時代。

過去困擾企業的高昂成本和技術門檻正在快速下降：MOE模型帶來的低硬體需求與高效能，使得先進的AI能力不再是大型企業的專利。透過QubicX，企業無需耗費數月自行整合各種AI工具，就能立即獲得全方位的AI應用方案。

有了像OSS 120B/20B這樣性能卓越且開放的模型，再加上QubicX平台的完整支援，各領域的企業都可以積極嘗試將AI融入核心業務，找到最適合自己的切入點。