文章报道 Meta 计划通过内部工具采集员工鼠标移动轨迹与键盘操作等真实电脑使用行为,用于训练能协助完成日常任务的人工智能模型。Meta 表示会采取保护措施并限定数据用途。报道指出这一做法反映出科技公司为获取训练数据不断拓展来源,也带来企业内部沟通和行为数据被用于训练素材的隐私与安全担忧;文中还提到有机构收集早期初创企业的内部通讯记录作为训练数据的相关报道。
4 月 22 日消息,据路透社报道,Meta 为其人工智能模型找到了新的训练数据来源:自家员工。该公司计划利用从员工鼠标移动轨迹和键盘敲击操作中收集的数据,致力于打造能力更强、效率更高的人工智能。

这反映出科技企业为寻找新的训练数据来源已无所不用其极,训练数据是人工智能模型的核心命脉,能帮助程序更高效地执行任务、回应用户查询。
Meta 一名发言人给出了如下声明:“如果我们要打造能帮助人们用电脑完成日常事务的智能助手,我们的模型就需要人们实际使用电脑的真实案例 —— 比如鼠标移动、点击按钮、操作下拉菜单等行为。为此,我们将推出一款内部工具,在特定应用中采集这类操作输入,以助力模型训练。我们已设置相应保护措施以保障敏感内容安全,且这些数据不会被用于其他任何用途。”
这一趋势似乎暴露出人工智能行业令人担忧的隐私隐患,昔日的企业内部沟通内容,正日益成为新的企业数据供应链原料。IT之家注意到,就在上周有报道称,有机构在搜罗早期初创企业的内部沟通资料(包括 Slack 聊天记录、Jira 工单及其他内部通讯平台信息),将其转化为人工智能的训练素材。