揪出火狐 Firefox 浏览器 271 个漏洞,Mozilla 回应“AI 抓虫”质疑

Mozilla 工程师使用 Anthropic 的 Claude Mythos Preview 模型和自建的 Agent Harness(智能体套件)对 Firefox 150 源代码进行自动化检测,发现并复现了 271 个漏洞(180 个高危、80 个中危、11 个低危)。为降低 AI“幻觉”误报,团队让模型生成针对特定源文件的测试用例(如特定 HTML),调用现有模糊测试工具运行,若触发内存崩溃则判定为漏洞;并引入第二个大模型对首个模型输出评分,只有高分报告才交付开发者。Mozilla 公布了 12 份完整 Bugzilla 报告,并称经过双重验证后误报几乎为零,相关测试用例已入库以防止复现。

5 月 8 日消息,Mozilla 工程师昨日(5 月 7 日)发布博文,披露使用 Anthropic 最强 AI 模型 Claude Mythos,排查出 271 个火狐 Firefox 浏览器安全漏洞幕后细节。

IT之家曾于上月(2026 年 4 月)报道,Mozilla 团队借助 Anthropic 的 Mythos Preview AI 模型,在火狐 Firefox 浏览器 150 版本中,发现并修复了 271 个漏洞。

Mozilla 回应外界质疑,在最新博文中指出,在发现的 271 个漏洞中,有 180 个达到“高危”级别,意味着用户正常浏览网页就可能触发;此外 80 个为中危,11 个为低危。

Mozilla 为了证明这不是 AI 炒作,公开了其中 12 份完整的 Bugzilla 报告。

Mozilla 工程师表示为了解决 AI 找 Bug 的“幻觉”顽疾,开发了专属的 Agent Harness(智能体套件)。此前让 AI 分析代码往往产出大量看似合理实则虚构的报告,人工复核成本极高。而这次突破主要归功于两点:模型自身能力提升,以及这套定制化套件。

这款套件向模型下达指令(如“在这个文件中找 Bug”),提供读写文件、评估测试用例等工具,并循环运行直到任务完成。

具体流程中,套件指向特定源文件,Mythos 自主构造测试用例,例如生成特定 HTML 代码,随后调用现有模糊测试工具运行。若触发内存崩溃,则判定找到漏洞。为了进一步过滤误报,Mozilla 引入第二个大模型对首个模型的输出打分,高分报告才交付开发者。

Mozilla 杰出工程师 Brian Grinstead 表示,经过双重验证,最终产出的漏洞报告几乎没有误报。这给了工程师明确的确认信号:问题存在,修复完成,且测试用例入库后不会复现。

参考

  • Behind the Scenes Hardening Firefox with Claude Mythos Preview

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...