文章作者、来源:36氪 今天,OpenAI祭出满血GPT-5.5-Cyber,要给全世界的开源代码修漏洞。结果话音刚落,Codex被扒出史诗级bug:一年狂写640TB,能把SSD直接写废。 刚刚,OpenAI重磅发布「满血版」GPT-5.5-Cyber! 这是迄今为止,最强大的网络安全模型,专为经授权的高级防御任务量文章作者、来源:36氪 今天,OpenAI祭出满血GPT-5.5-Cyber,要给全世界的开源代码修漏洞。结果话音刚落,Codex被扒出史诗级bug:一年狂写640TB,能把SSD直接写废。 刚刚,OpenAI重磅发布「满血版」GPT-5.5-Cyber! 这是迄今为止,最强大的网络安全模型,专为经授权的高级防御任务量

尴尬了,OpenAI刚派GPT-5.5-Cyber修补地球,Codex却爆出致命bug

2026/06/23 10:47
阅读时长 10 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源:36氪

今天,OpenAI祭出满血GPT-5.5-Cyber,要给全世界的开源代码修漏洞。结果话音刚落,Codex被扒出史诗级bug:一年狂写640TB,能把SSD直接写废。

刚刚,OpenAI重磅发布「满血版」GPT-5.5-Cyber!

这是迄今为止,最强大的网络安全模型,专为经授权的高级防御任务量身定制。

在权威CyberGym基准测试中,它一举拿下85.6%高分,强势击败Mythos 5。

其核心能力涵盖:踪漏洞代码、验证安全隐患、生成补丁,并为人工审查提供证据。

同在今天,Codex Security插件同步首发——

不仅能修复现有系统中的漏洞,还能自动防止新漏洞进入生产环境。

谁曾想,几乎同一时间,Codex竟被曝出了「史诗级」漏洞。

不少开发者反馈,Codex 在执行流式任务和长时间运行时,会以极高的频率向本地SQLite日志疯狂写入数据。

一年预估写入640TB,这足以在一年内写废一块消费级SSD。

OpenAI一边抛出「修补地球」的安全神话,另一边就爆出了「烧穿硬盘」的致命 Bug。

现实版的冰与火之歌,同框上演了!

「满血」GPT-5.5-Cyber登场

强压Mythos 5

不得不说,OpenAI这次是真的下了血本。

它一口气甩出了网安计划Daybreak(破晓)的三大核心战略,核心叙事只有一句话——

AI已经改变了网络安全的「物理定律」。

这次发布的核心,是GPT-5.5-Cyber的完整版。

这是OpenAI迄今最强的「网络安全专用模型」,专门给「经过验证的防御者」准备的最强网安工具。

在CyberGym基准上,它拿到了85.6%,单模型最高分。

作为对比,普通版GPT-5.5是81.8%,而Claude Opus 4.7,停在了73.1%。

在考核「能不能把漏洞变成真实攻击代码」的ExploitGym上,Cyber版39.5% VS 普通版25.95%;

在考核长链条漏洞挖掘的SEC-bench Pro上,Cyber版69.8% VS 普通版63.1%。

三个基准,满血Cyber版,全面碾压GPT-5.5。

Codex塞进「AI安全工程师」

亮出「破晓」之刃

如果说GPT-5.5-Cyber是矛,那Codex Security就是那把递到每个开发者手边的盾。

OpenAI更新了Codex Security插件,把它直接焊进了Codex的工作流里——

开箱即用的漏洞扫描、威胁建模、攻击路径追踪、补丁自动生成,一条龙。

它的逻辑很简单粗暴:在每个程序员身边,塞一个安全工程师。

自今年3月研究预览上线以来,Codex Security已经扫描了超过3000万次提交,覆盖3万多个代码仓库。

其中,人工复核确认修复的发现超过7万个,自动判定修复的超过50万个。

这就是当下「补漏洞」必须达到的规模:以前是人海战术,现在是机器速度。

修补地球,成了KPI

OpenAI还发起了一个听起来就很燃的计划——Patch the Planet(修补地球)。

为什么这件事重要?因为开源世界的真相,残酷得有点反直觉。

被广泛使用的开源项目里,94%的项目,一年内90%以上的新增代码,靠的是不到10个开发者。

撑起半个互联网的代码,背后常常只有几个人在熬夜。

AI让「找漏洞」变得越来越快,可这反而成了维护者的灾难——成千上万份报告砸过来,一大半还是低质量的误报。

所以「修补地球」的核心,恰恰是专业人工

研究员先去重、先验证,把干净的补丁送到维护者面前,而不是把噪声一股脑倒给他们。

首批30多个开源项目已承诺加入,包括cURL、Go、Python、Sigstore、pyca/cryptography等。

一个五天冲刺就在19个项目里浮现出数百个问题、合并了数十个补丁。

除此之外,OpenAI宣布启动Daybreak(破晓)网络安全合作伙伴计划。

它把自己最强的模型能力,通过Cisco、CrowdStrike、Palo Alto Networks、Cloudflare等近30家安全巨头的产品,输送到千千万万家组织里。

在政府层面,OpenAI已经和美、英、欧盟的ENISA等机构,建立了「可信网络安全访问」合作。

简言之,OpenAI不只是要做一个模型,它要做全球网络安全的底层操作系统。

这盘棋下得很大,姿态也摆得极高。

「破晓」这个名字本身就在暗示:黎明已至,防御者将在攻击者动手之前,抢先完成修复。

听上去,一切都那么完美。直到网友们打开了自己的硬盘监控——

「高强度使用Codex的宝子们注意一下,你的磁盘可能正在遭受核打击」。

Codex狂写日志

一年烧穿一块SSD

事情是这样的,有GitHub开发者们发现:

Codex在流式传输和自动化长任务时,会以约5MB/s(实测峰值甚至到16MB/s)的恐怖速度,疯狂往本地一个叫~/.codex/logs_2.sqlite 的SQLit日志文件里写TRACE日志。

5MB/s是什么概念?换算一下,一年大概要写640TB。

而一块普通消费级SSD的标称写入寿命(TBW)大约只有600TB。

也就是说,要不了一年,光是Codex在后台默默写的这些日志,就能把整块固态硬盘的寿命彻底榨干。

最细思极恐的地方在于:这一切是「静默」发生的。

一位GitHub用户1996fanrui实测,自己机器开机运行21天,主SSD就被写进去了约37TB数据。

一查,罪魁祸首正是Codex的SQLite日志。

可打开文件管理器一看,这文件大小却平平无奇——

因为它在疯狂地「写入再删除、写入再删除」,每分钟上万次插入与清理,文件不大,但实际砸到闪存上的写入量,远超人们肉眼能看到的。

实际上,这个相关问题最早在今年4月就有人提了issue(#17320),之后一路有人补刀——

#24275、#22444,再到6月14日那个直接通天上的#28224。

GitHub地址:

OpenAI最近的更新日志里确实碰了碰SQLite的稳定性,可对「写入速率」这个核心问题,一直都没修。

issue还大大地开着。

官方回复:已修复

就在刚刚,OpenAI研究员Vaibhav (VB) Srivastav及时回应道:

这一问题已的得到修复,并随着最新Codex版本一同发布了。

他提醒道,「所有人务必通过npm、bash安装脚本将Codex升级到最新版本」。

同一个智能,能修补地球,也能烧穿你的硬盘。

能力的两面,本就长在同一具身体上。

当AI改写网络安全的「物理定律」,它改写的也是人类「看得见」的边界。

黎明已至。只是这一次,照亮世界的光,会不会也是我们看不清自己造物的开始?

市场机遇
CyberConnect 图标
CyberConnect实时价格 (CYBER)
$0.3516
$0.3516$0.3516
-4.89%
USD
CyberConnect (CYBER) 实时价格图表

CHZ一周暴涨28%!2022年的暴跌会重演吗?

CHZ一周暴涨28%!2022年的暴跌会重演吗?CHZ一周暴涨28%!2022年的暴跌会重演吗?

上MEXC 0费率多空双向布局,涨跌皆有应对之策!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

世界杯预测,一单串多场,搏200倍收益!

世界杯预测,一单串多场,搏200倍收益!世界杯预测,一单串多场,搏200倍收益!

MEXC App 6.60.0 全新升级,巴西/法国/阿根廷等最多20场组合,一键轻松下注!