OpenAI 开出最高 44.5 万美元年薪招聘研究员,要求有品位、有策略性

报道指出,OpenAI 在其 Preparedness 安全团队招募研究员,岗位年薪约 29.5 万至 44.5 万美元,目标是寻找能够支持“递归式自我改进”准备工作的技术执行者。职位要求对未来可能出现但尚未普遍存在的问题进行推理,强调“良好品味和策略”。工作重点包括防御数据投毒攻击、开发解释模型推理过程的工具、通过实验理解模型安全性与风险,并追踪技术岗位自动化(如 AI 编程工具)进展。文章同时将此招聘置于更广泛背景:OpenAI 希望在未来实现研究自动化(包括 CEO 提出的在 2026 年前运行自动化 AI 研究实习生及到 2028 年实现真正自动化研究员的目标),并提及 Anthropic 在用 AI 监督更强模型方面的研究与其联合创始人对 2028 年前研发可能完全脱离人类的估计。

5 月 23 日消息,据《商业内幕》23 日(今天)下午报道,OpenAI 发布了安全研究员的招聘信息,研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。

职位聚合网站显示,这则招聘信息面向 OpenAI Preparedness 安全团队,本月上线。该岗位年薪高达 29.5 万至 44.5 万美元(IT之家注:现汇率约合 200.8 万至 303 万元人民币),目标是寻找“能够支持递归式自我改进准备工作的强大技术执行者”。

招聘信息写道:“这项工作依赖于对未来可能存在、但当前未必已经存在的问题进行推理。因此,这一岗位尤其需要具备良好品味和策略(tasteful and strategic)的人才。”

当前,OpenAI 正着眼于实现自身研究工作的自动化的目标。去年 10 月,CEO 奥尔特曼曾表示,OpenAI 的目标是在今年 9 月前利用数十万枚芯片运行“自动化 AI 研究实习生”,并在 2028 年 3 月前实现“真正的自动化 AI 研究员”。他补充说,“我们完全有可能无法实现这一目标。但考虑到潜在影响极其巨大,我们认为公开说明这些目标符合公众利益。”

Anthropic 今年 4 月发布研究,尝试利用 AI 模型监督更强大的 AI 模型,并取得了有限但积极的结果。今年 5 月,Anthropic 联合创始人兼政策主管杰克 · 克拉克提出观点:到 2028 年底前,AI 研发完全脱离人类参与的概率“大约为 60%”。

OpenAI 的这则招聘信息提到,研究员预计需要重点研究如何防御“数据投毒”攻击,即攻击者通过训练数据破坏 AI 模型的行为;需要开发用于解释模型推理过程的工具,或通过实验理解模型的安全性与潜在风险;需要“追踪技术岗位自动化进展”,其中包括衡量 AI 编程工具的使用情况。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...