网站首页 文章专栏 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
Kimi-Researcher 是基于端到端自主强化学习技术训练的新一代智能体模型,专为深度研究任务而生,现已开启小范围灰度测试。该模型能够自主规划任务执行流程,生成详实的深度研究报告和动态可视化报告。
6 月 21 日消息,IT之家从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。
Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。
对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:
为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。
用户最终将收到 2 个交付成果。
一份信息详实、可溯源的深度研究报告
一个可交互、可分享的动态可视化报告
官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:
这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。