揪出火狐 Firefox 浏览器 271 个漏洞，Mozilla 回应“AI 抓虫”质疑

Mozilla 工程师使用 Anthropic 的 Claude Mythos Preview 模型和自建的 Agent Harness（智能体套件）对 Firefox 150 源代码进行自动化检测，发现并复现了 271 个漏洞（180 个高危、80 个中危、11 个低危）。为降低 AI“幻觉”误报，团队让模型生成针对特定源文件的测试用例（如特定 HTML），调用现有模糊测试工具运行，若触发内存崩溃则判定为漏洞；并引入第二个大模型对首个模型输出评分，只有高分报告才交付开发者。Mozilla 公布了 12 份完整 Bugzilla 报告，并称经过双重验证后误报几乎为零，相关测试用例已入库以防止复现。

5 月 8 日消息，Mozilla 工程师昨日（5 月 7 日）发布博文，披露使用 Anthropic 最强 AI 模型 Claude Mythos，排查出 271 个火狐 Firefox 浏览器安全漏洞幕后细节。

IT之家曾于上月（2026 年 4 月）报道，Mozilla 团队借助 Anthropic 的 Mythos Preview AI 模型，在火狐 Firefox 浏览器 150 版本中，发现并修复了 271 个漏洞。

Mozilla 回应外界质疑，在最新博文中指出，在发现的 271 个漏洞中，有 180 个达到“高危”级别，意味着用户正常浏览网页就可能触发；此外 80 个为中危，11 个为低危。

Mozilla 为了证明这不是 AI 炒作，公开了其中 12 份完整的 Bugzilla 报告。

Mozilla 工程师表示为了解决 AI 找 Bug 的“幻觉”顽疾，开发了专属的 Agent Harness（智能体套件）。此前让 AI 分析代码往往产出大量看似合理实则虚构的报告，人工复核成本极高。而这次突破主要归功于两点：模型自身能力提升，以及这套定制化套件。

这款套件向模型下达指令（如“在这个文件中找 Bug”），提供读写文件、评估测试用例等工具，并循环运行直到任务完成。

具体流程中，套件指向特定源文件，Mythos 自主构造测试用例，例如生成特定 HTML 代码，随后调用现有模糊测试工具运行。若触发内存崩溃，则判定找到漏洞。为了进一步过滤误报，Mozilla 引入第二个大模型对首个模型的输出打分，高分报告才交付开发者。

Mozilla 杰出工程师 Brian Grinstead 表示，经过双重验证，最终产出的漏洞报告几乎没有误报。这给了工程师明确的确认信号：问题存在，修复完成，且测试用例入库后不会复现。

参考

Behind the Scenes Hardening Firefox with Claude Mythos Preview