OpenAI 宣布 GPT-5.5 Instant 向全體用戶開放,幻覺率在高風險場景下減少 52.5%、AIME 數學測試從 65.4 分躍升至 81.2 分。
(前情提要:OpenAI 推出網路安全專用模型 GPT-5.4-Cyber:已修補 3,000 個高危漏洞,較勁 Claude Mythos)
(背景補充:17歲高中生寫出「神級Prompt」強化Claude推理能力媲美o1模型,如何實現?)
GPT-5.5 Instant 正式向全體用戶開放,官方公告指出 GPT-5.5 Instant 在醫療、法律、金融等高風險場景中虛構聲明減少 52.5%、用戶標記為事實錯誤的對話中錯誤聲明減少 37.3%。
數學推理也跳了一階。AIME 2025 從前代的 65.4 分拉到 81.2 分。AIME 是推理鏈完整性的壓力測試,代表模型在多步驟邏輯上有結構性改進。
開放範圍自 5 月 5 日起涵蓋全體用戶、免費帳號同樣可用,只有個人化記憶功能(引用過往對話、上傳檔案、Gmail)仍鎖在 Plus 與 Pro 且暫限網頁版。
OpenAI 教你怎麼寫提示詞
就在前幾天,OpenAI 同樣公開了一份官方建議的提示詞結構指南。官方表示絕大多數人寫提示詞的方式,從邏輯上就跑偏了。
OpenAI 在開發者檔案中給出建議的提示詞結構共七個區塊,依序是:
- Role(角色設定)
- Personality(個性語氣)
- Goal(目標說明)
- Success criteria(成功標準)
- Constraints(限制條件)
- Output(輸出格式)
- Stop rules(停止條件)。
第一個關鍵轉變是「結果先行」。舊寫法的邏輯是逐步指揮:先做 A、再做 B、然後輸出 C。
新寫法的邏輯是定義終點,先把成功標準寫清楚,讓模型自己決定走哪條路到那裡。OpenAI 明確建議,改變舊提示詞的第一件事是刪掉程式性步驟,改成結果描述。
第二個轉變是 reasoning effort 的用法。reasoning effort 是模型「想多深」的等級,等級越高代表回答前思考越久、成本也越貴。
官方建議多數生產場景用 low 或 medium 就夠,高等級只該留給多步推導、格式化輸出或資料抽取拉到 high 純粹是燒錢。
其他幾個具體建議也值得參考:
- Stop rules 要明寫「什麼狀態下不必繼續做」,例如找到第一個符合條件的結果就停
- Retrieval Budgets(檢索預算)要給模型搜尋次數上限,防止無限展開
- 草稿類任務則建議先定義「不想要什麼」,比定義「想要什麼」更有效 — 負面約束的邊界,模型比正向描述更好識別。
📍相關報導📍
OpenAI 推出網路安全專用模型 GPT-5.4-Cyber:已修補 3,000 個高危漏洞,較勁 Claude Mythos
17歲高中生寫出「神級Prompt」強化Claude推理能力媲美o1模型,如何實現?
OpenAI 強化 GPT-4o 衝上排行榜第二!Sam Altman:更懂人話和寫程式,創造力大增
GPT-5延期!OpenAI先推o3、o4-Mini,Sam Altman自曝:整合比想像中更難
Alpha掘金》Wayfinder AI代理能「共同學習」執行DeFi任務,免費註冊可參與空投








