OpenAI 最近推出了名為 GPT-OSS 的開源模型,此乃自 2019 年發佈 GPT-2 以來,首個擁有公開權重的模型。GPT-OSS 提供了兩個版本,其中包括 1200 億參數的 gpt-oss-120b 及 200 億參數的 gpt-oss-20b。較大型號可在單個 Nvidia GPU 上運行,其性能媲美現有的 o4-mini 模型,而較小坪的版本則可在僅具 16GB 記憶體的設備上運行,績效與 o3-mini 模型相當。這兩個版本均是依據 Apache 2.0 授權,允許商業用途並可在 Hugging Face 等平台免費下載。
OpenAI 的 CEO Sam Altman 曾承認公司在開源模型的歷史上未曾取得正確的立場,尤其在中國初創公司 DeepSeek 今年推出具有成本效益的開源模型之後。Altman 指出,開源模型的創新希望能在美國推展,並強調這些模型是「建基於民主價值觀,免費提供給大眾使用」。聯合創辦人 Greg Brockman 更是將這一發佈視為現有收費服務的「補充」,而非競爭對手。
GPT-OSS 模型運用了 OpenAI 去年秋季在 o1 模型中首次應用的思維鏈推理方法,透過多步驟回答提示。這些純文字模型雖然不屬於多模態,但具備網頁瀏覽、調用雲端模型協助執行任務、執行程式碼以及作為 AI 代理程式控制軟件的功能。與 ChatGPT 不同的是,GPT-OSS 可以在無網絡的環境及防火牆後獨立運行。
由於公開權重模型降低了使用門檻,使得任何人都能試圖調整模型以用於不當用途,OpenAI 為此進行了歷史上最嚴格的安全測試。安全研究員 Eric Wallace 表示,團隊在風險領域內對模型進行了細緻的微調測試,並對可達到的風險深入評估。根據 OpenAI 的準備框架評估,這一公開權重模型並未達到高風險水平,且模型會展示「思維鏈」的過程,讓用戶能夠監察模型行為、糾正誤導和濫用情況。
研究員 Chris Koch 提及,gpt-oss-120b 的效能與 OpenAI 的 o3 和 o4-mini 模型相當,某些評估中甚至更勝一籌。此次發佈也對當前的開源生態系統領導者 Meta 造成挑戰。Meta 自 2023 年推出的首個 Llama 系列模型,其中最近的 Llama 4 仍為市場上的主流產品,而 Mark Zuckerberg 也曾暗示,基於安全因素,未來的模型可能會考慮放棄開源策略。
此次發佈正是在 OpenAI 與 Meta 等科技公司之間的 AI 人才競爭愈演愈烈的背景下進行的。2025 年,需求高的 AI 研究人員將會面臨高額的職位邀請。OpenAI 的新發布可能為 Meta 帶來激烈的競爭,而其具體影響則取決於開發者對 GPT-OSS 模型的接受程度。與此同時,Meta 也專注於開發超越人類認知的超級智能,並成立了一個由前 Scale 的 CEO Alexandr Wang 領導的內部實驗室。
此次發佈標誌著 AI 行業競爭格局的重大轉變。隨著中美在 AI 技術領域的競爭加劇,預計更多美國科技公司將會模仿 OpenAI,推出開源模型以應對中國的競爭者。在未來幾個月內,我們或將看到 Google、Microsoft 等科技巨頭加快推出開源模型的步伐,同時在安全標準及性能基準方面的競爭也會愈加激烈。



