OpenAI 开出最高 44.5 万美元年薪招聘研究员，要求有品位、有策略性

报道指出，OpenAI 在其 Preparedness 安全团队招募研究员，岗位年薪约 29.5 万至 44.5 万美元，目标是寻找能够支持“递归式自我改进”准备工作的技术执行者。职位要求对未来可能出现但尚未普遍存在的问题进行推理，强调“良好品味和策略”。工作重点包括防御数据投毒攻击、开发解释模型推理过程的工具、通过实验理解模型安全性与风险，并追踪技术岗位自动化（如 AI 编程工具）进展。文章同时将此招聘置于更广泛背景：OpenAI 希望在未来实现研究自动化（包括 CEO 提出的在 2026 年前运行自动化 AI 研究实习生及到 2028 年实现真正自动化研究员的目标），并提及 Anthropic 在用 AI 监督更强模型方面的研究与其联合创始人对 2028 年前研发可能完全脱离人类的估计。

5 月 23 日消息，据《商业内幕》23 日（今天）下午报道，OpenAI 发布了安全研究员的招聘信息，研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。

职位聚合网站显示，这则招聘信息面向 OpenAI Preparedness 安全团队，本月上线。该岗位年薪高达 29.5 万至 44.5 万美元（IT之家注：现汇率约合 200.8 万至 303 万元人民币），目标是寻找“能够支持递归式自我改进准备工作的强大技术执行者”。

招聘信息写道：“这项工作依赖于对未来可能存在、但当前未必已经存在的问题进行推理。因此，这一岗位尤其需要具备良好品味和策略（tasteful and strategic）的人才。”

当前，OpenAI 正着眼于实现自身研究工作的自动化的目标。去年 10 月，CEO 奥尔特曼曾表示，OpenAI 的目标是在今年 9 月前利用数十万枚芯片运行“自动化 AI 研究实习生”，并在 2028 年 3 月前实现“真正的自动化 AI 研究员”。他补充说，“我们完全有可能无法实现这一目标。但考虑到潜在影响极其巨大，我们认为公开说明这些目标符合公众利益。”

Anthropic 今年 4 月发布研究，尝试利用 AI 模型监督更强大的 AI 模型，并取得了有限但积极的结果。今年 5 月，Anthropic 联合创始人兼政策主管杰克 · 克拉克提出观点：到 2028 年底前，AI 研发完全脱离人类参与的概率“大约为 60%”。

OpenAI 的这则招聘信息提到，研究员预计需要重点研究如何防御“数据投毒”攻击，即攻击者通过训练数据破坏 AI 模型的行为；需要开发用于解释模型推理过程的工具，或通过实验理解模型的安全性与潜在风险；需要“追踪技术岗位自动化进展”，其中包括衡量 AI 编程工具的使用情况。