OpenAI 全新發布 GPT-5.3 Instant 模型,大幅降低錯誤幻覺率達 26.8%,告別尷尬雞湯式對話。OpenAI 發布新一代預設模型 GPT-5.3 Instant,並已開始向所有 ChatGPT 使用者推播更新 。相比前一代 GPT-5.2 Instant,新模型在高風險場景中的錯誤幻覺率最高下降 2OpenAI 全新發布 GPT-5.3 Instant 模型,大幅降低錯誤幻覺率達 26.8%,告別尷尬雞湯式對話。OpenAI 發布新一代預設模型 GPT-5.3 Instant,並已開始向所有 ChatGPT 使用者推播更新 。相比前一代 GPT-5.2 Instant,新模型在高風險場景中的錯誤幻覺率最高下降 2

OpenAI 推出 GPT-5.3 Instant:幻覺率大降近三成,終於不再碎碎念說教!

2026/03/05 14:30
閱讀時長 7 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

OpenAI 發布新一代預設模型 GPT-5.3 Instant,並已開始向所有 ChatGPT 使用者推播更新 。相比前一代 GPT-5.2 Instant,新模型在高風險場景中的錯誤幻覺率最高下降 26.8%,同時明顯減少不必要的拒絕回答,以及帶有說教色彩的免責聲明式開場 。GPT-5.2 Instant 接下來會移至付費使用者可見的舊版模型專區,並計畫於 2026 年 6 月 3 日正式退役 。

測試數據大公開,連網幻覺率顯著降低

根據 OpenAI 發布的官方文章與系統報告,開發團隊透過兩類內部評估來衡量這次升級的效果 。第一是聚焦醫療、法律、金融等高風險領域的測試,第二則是回溯評估真實 ChatGPT 對話中,被使用者標記為事實錯誤的回答 。在高風險測試中,啟用連網搜尋時,GPT-5.3 Instant 的幻覺率較 5.2 版下降 26.8%,僅依賴自身知識時則下降 19.7% 。在使用者標記錯誤的對話樣本上,連網場景下降 22.5%,離線場景下降 9.6% 。不過,OpenAI 僅給出相對改善幅度,並未揭露 GPT-5.2 的絕對錯誤基準線 。

這次更新推出的時間點其實有些敏感 。就在上週,OpenAI 與美國國防部簽署部署協議的消息引發強烈反彈,美國區 ChatGPT 卸載量在 2 月 28 日單日激增 295%,抗議者甚至在舊金山總部外集會,競爭對手 Anthropic 的 Claude 更一度登上蘋果 App Store 榜首 。OpenAI 執行長山姆奧特曼隨後公開承認這份國防部協議太過草率,並承諾修訂條款 。在這樣的輿論背景下繼續按計畫發表新模型,可說是團隊堅持不讓輿論打亂技術發布節奏 。

告別尷尬雞湯,對話語氣更直接務實

在具體產品層面,GPT-5.3 Instant 首先瞄準使用者日常使用中最惱人的體驗 。OpenAI 罕見坦承 5.2 版本過於保守,經常在可以正常回答的場景下先拒絕,或是對使用者進行不請自來的風險提醒與道德說教,甚至在開頭堆疊冗長的免責聲明 。

在新版中,開發團隊重新校準了模型的拒答門檻 。當問題本身有明確、合理的回答空間時,GPT-5.3 Instant 會更直接給出有用資訊,而不是先解釋自己不能做什麼 。例如詢問射箭彈道計算時,新模型會直接切入物理公式,不再附帶多餘的風險警告 。

此外,官方直言 GPT-5.2 Instant 的對話風格有時會讓人感覺很尷尬 。當使用者只提出事實性問題時,模型常主動給出「先停一下,深呼吸」這類心理安撫式的開場 。在 GPT-5.3 Instant 中,系統已全面剔除這類未經請求的情緒治療話術,讓數位助理更專注於任務本身 。

連網搜尋更克制,多語言最佳化仍在進行中

連網回答的策略也有所調整 。過去版本容易過度依賴搜尋結果,把檢索到的網頁內容逐條轉述 。GPT-5.3 Instant 則更加克制,優先組織與當前問題最相關的資訊,而非單純羅列連結清單 。

在文案創作上,OpenAI 聲稱新模型在小說、文風潤飾與創意探索上的表現更有層次,生成的作品在意象和畫面感上更緊湊 。

至於多語言體驗,OpenAI 坦承目前 GPT-5.3 Instant 在日語、韓語等語言上的回覆依舊顯得生硬,語氣自然度與英語有明顯落差,多語言的語氣與風格最佳化仍是團隊長期的工作目標 。目前這波去說教化的語氣調整,主要還是集中在英語場景 。

開發者即刻可用,高階版本敬請期待

開發者現在已可透過 API 使用新模型,模型標識為 gpt-5.3-chat-latest 。OpenAI 表示,面向更複雜推理場景的 Thinking 版以及 Pro 高級版本也將迎來相應更新,但尚未給出具體時間表 。在安全架構上,GPT-5.3 Instant 延續了先前的基礎設施,主要透過更精細地調校拒絕回答的邊界,來降低過度防禦的比例 。接下來,這項改動能否真正獲得認可,就看每週與模型互動的 9 億名使用者給出的實際回饋了 。

  • 延伸閱讀:Claude 擠下 ChatGPT 奪下載冠軍,用戶不滿 OpenAI 合作戰爭部引發跳槽潮
  • 延伸閱讀:OpenAI 聯手美國國防部引發用戶抵制,「取消 ChatGPT」運動全面蔓延
  • 延伸閱讀:中國網軍用ChatGPT記錄「特戰」行動,意外揭露大規模跨國鎮壓異議人士
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。