OpenAI 推出 Gpt-oss-120b 和 Gpt-oss-20b,將最先進的模型引入本地設備
簡單來說 OpenAI 發布了兩款強大的開放權重模型 GPT-OSS-120b 和 GPT-OSS-20b,可在無需互聯網接入的情況下實現先進的本地 AI 性能,標誌著開發者可訪問性邁出了重要一步。
人工智慧研究機構 OpenAI 宣布發布兩款先進的開源語言模型,分別為 GPT-OSS-120B 和 GPT-OSS-20B。這些模型在實際應用中表現出色,同時保持了較低的營運成本。它們採用靈活的 Apache 2.0 許可證發布,在推理任務中超越了其他類似規模的開源模型,展現了強大的工具使用能力,並針對消費級硬體的高效運行進行了優化。訓練過程融合了強化學習技術,並結合了來自 OpenAI最先進的內部模型,包括o3和其他尖端系統。
gpt-oss-120b 模型的表現幾乎與 OpenAI的 o4-mini 模型在基礎推理基準測試中表現出色,並在單一 80 GB GPU 上高效運行。同時,gpt-oss-20b 模型取得了與 OpenAI的 o3-mini 在常見基準測試中表現出色,能夠在僅配備 16 GB 內存的邊緣設備上運行,因此非常適合用於設備端應用、本地推理或快速測試,而無需昂貴的基礎設施。這兩個模型在工具使用、小樣本函數呼叫和思路鏈 (CoT) 推理方面都表現出了強大的能力,正如 Tau-Bench 代理評估和 HealthBench 所展示的那樣,有時甚至優於專有模型,例如 OpenAI o1 和 GPT-4o.
這些模型與 Responses API 相容,旨在整合到 Agentic 工作流程中,提供進階指令遵循、工具使用(包括 Web 搜尋和 Python 程式碼執行)以及推理功能。這包括可調節的推理力度,以針對不需要複雜推理或優先考慮最終輸出低延遲的任務進行最佳化。這兩個模型均完全可定制,支援完整的思路鏈推理,並適應結構化的輸出格式。
安全考量是這些模型發布的核心,尤其考慮到其開放性。除了全面的安全訓練和評估外,我們還透過對抗微調的 GPT-OSS-120B 版本進行了額外的測試,測試環境為: OpenAI的準備框架。 GPT-OSS 模型實現了與 OpenAI最新的專有模型,為開發人員提供類似的安全保障。詳細結果和更多資訊可在研究論文和模型卡中找到,其方法已由外部專家審核,代表了在建立開放式模型新安全標準方面取得的進展。
OpenAI 已與 AI Sweden、Orange 和 Snowflake 等早期合作夥伴合作,探索這些開放模型的實際應用,包括用於資料安全的本地託管以及針對特定資料集的微調。這些開放模型的推出旨在賦能廣泛的用戶——從個人開發者到大型企業和政府機構——在自己的基礎架構上運行和自訂 AI。與其他模型結合使用時,可以透過 OpenAI的 API,開發人員可以從一系列平衡效能、成本和延遲的選項中進行選擇,以支援多樣化的 AI 工作流程。
Gpt-oss-120b 和 Gpt-oss-20b 現已免費提供,並提供廣泛的平台和硬體支援
gpt-oss-120b 與 gpt-oss-20b 的權重皆可在 Hugging Face 上公開下載,並以 MXFP4 格式提供原生量化。這使得 gpt-oss-120b 模型能夠在 80GB 記憶體容量內運行,而 gpt-oss-20b 型號僅需 16GB 記憶體。這兩個型號均已使用 Harmony Prompt 格式進行了後訓練,並且提供了一個開源的 Harmony 渲染器(Python 和 Rust 版本),以方便使用者採用。此外,還提供了使用 PyTorch 和 Apple Metal 平台進行推理的參考實現,以及一組用於實際應用的範例工具。
這些模型的設計兼具靈活性和易用性,支援本地部署、設備部署或透過第三方推理提供者部署。為了增強可訪問性,我們在發布之前就與 Azure、Hugging Face、vLLM、O 等主要部署平台建立了合作夥伴關係。llama, llama.cpp、LM Studio、AWS、Fireworks、Together AI、Baseten、Databricks、Vercel、Cloudflare 和 OpenRouter。我們也與 NVIDIA、AMD、Cerebras 和 Groq 等硬體製造商進行了合作,以確保在各種系統上實現最佳效能。
配合此版本發布,微軟也為 Windows 裝置提供了針對 GPU 最佳化的 gpt-oss-20b 模型版本。這些版本由 ONNX Runtime 提供支持,支援本地推理,可透過 Foundry Local 和 AI Toolkit for VS Code 訪問,從而簡化了 Windows 平台上開發人員的整合流程。
對於尋求完全可自訂、能夠在自身環境中進行微調和部署的模型的開發者來說,GPT-OSS 模型提供了一個合適的解決方案。相反,對於那些需要多模態功能、內建工具和無縫平台整合的開發者來說,透過 API 平台提供的模型仍然是首選。我們會持續關注開發者的回饋,並可能考慮未來為 GPT-OSS 模型提供 API 支援。
GPT-OSS-120b 和 GPT-OSS-20b 的推出代表了開放權重模型領域的顯著進步,顯著提升了其規模下的推理能力和安全性。這些開放模型是專有託管模型的補充,為開發者提供了更廣泛的工具選擇,以促進前沿研究、激發創新,並促進跨各種應用更安全、更透明的 AI 開發。
此外,這些開放模型有助於降低新興市場、資源匱乏的行業以及在採用專有解決方案方面可能面臨限制的小型組織的進入門檻。透過提供易於存取且功能強大的工具,全球用戶能夠開發、創新並創造新的機會。這些在美國生產的高性能開放模型的廣泛普及,有助於擴大公平的人工智慧使用範圍。
可靠的開放模型生態系統是促進廣泛包容的人工智慧普及的關鍵要素。我們鼓勵開發者和研究人員利用這些模型進行實驗、協作,並不斷突破可實現的極限。我們期待該領域的持續進展。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
Bitget 發布 2025 年 7 月保護基金估值報告
Bitget 現貨槓桿新增 TOWNS/USDT!
【首發上架】GHO(GHO)將於 Bitget 創新區上架
CandyBomb x TOWNS:合約交易瓜分 675,000 TOWNS!
加密貨幣價格
更多








