中国科学家提出“AI 语言”:人类难懂但模型能懂,文本压缩至 27.9% 仍保留 99.5% 语义

来自上海交通大学、悉尼大学、合肥工业大学、西安交通大学和南京大学的研究团队在 arXiv 发布论文,提出了面向模型的文本表示方法“BabelTele”。该方法将为人类设计的自然语言压缩为模型可读但人类难懂的混合符号序列,实验显示可将文本压缩至约 27.9% 同时保留约 99.5% 语义准确性。研究在 QuALITY、MeetingBank 等基准及多智能体通信与记忆任务上验证了效果:人类可读性下降而模型(如 Gemini 3.1 Pro)理解能力保持稳定,且生成的压缩文本可以在不同模型间零样本传递,在通信中可减少约 40% Token 仍保持>96% 任务完成度。作者将其定位为探索性的“模型原生语言”概念验证,指出传递效果依赖于压缩与阅读模型的配对。

6 月 20 日消息,上海交通大学、悉尼大学、合肥工业大学、西安交通大学、南京大学的研究人员于 6 月 18 日在预印本平台 arXiv 上发表了一项有趣的研究。

正如论文标题《大语言模型并不总是需要可读语言》,他们发现 AI 能够理解人类理解不了的精简语言,所以 AI 提示词中的大部分自然语言都属于浪费 Token 的冗余信息。

他们提出了一种名为“BabelTele”的文本压缩方法,能够生成让人类几乎无法直接阅读的内容,但大语言模型(LLM)却可以准确理解其中的含义。

其研究的核心思想是,当前大语言模型之间的交互普遍采用为人类设计的自然语言,这包含了大量冗余信息。BabelTele 则是一种面向模型而非人类的文本表示方法,它通过融合多语言词汇、数学符号、逻辑运算符甚至表情符号,将原始文本压缩成一种高度密集的“模型语言”。

论文展示了这种方法的强大压缩能力:在实验中,BabelTele 能将文本压缩至原来的 27.9%,同时仍保持高达 99.5% 的语义准确性。

为了验证其有效性,研究团队设计了一系列实验。他们选取了 QuALITY 长文本问答数据集中的样本,分别让人类读者和 AI 模型(Gemini 3.1 Pro)阅读原文和 BabelTele 压缩后的文本并回答问题。

结果显示,人类读者在阅读 BabelTele 文本后,问答准确率显著下降,而 Gemini 3.1 Pro 的准确率则保持稳定。这表明,BabelTele 在牺牲人类可读性的同时,并未丢失模型可恢复的语义信息。

在更广泛的测试中,BabelTele 在多个基准测试中都表现出色。无论是处理会议纪要(MeetingBank)还是长文档问答(QuALITY),BabelTele 在同等压缩率下的准确率都优于传统的自然语言摘要和专门的提示压缩工具(如 LLMLingua-2)。

此外,BabelTele 还被验证可以在不同的大语言模型间“零样本”传递,即由一个模型生成的压缩文本,另一个模型无需额外训练即可理解,堪称 AI 之间的“AI 语言”。不过,研究也指出,其传输效果取决于压缩模型和阅读模型的配对。

在更贴近实际应用的场景中,BabelTele 也展现了相当不凡的潜力。在多智能体通信测试中,它能在减少约 40% 通信 Token 的同时,保持超过 96% 的任务完成度。在智能体记忆任务(LoCoMo 基准测试)中,BabelTele 的记忆保留效果也优于普通的摘要方法。

这项研究为 AI 行业提供了一个新的视角:在 AI Agent 和长文本处理等场景中,为大语言模型设计的“AI 语言”或许是提升效率的一种有效途径。虽然目前 BabelTele 更多是一个探索性的概念验证,但它打开了一扇通往“模型原生语言”的大门。

IT之家附论文地址: https://doi.org/10.48550/arXiv.2606.19857

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...