内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险

内部文件曝光:Meta严防员工使用Claude、Codex	,防范知识蒸馏风险-第1张图片

  元平台(Meta)正逐步减少对 Anthropic 、OpenAI 旗下高价 AI 代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具 ,导致自研过程涉嫌窃取竞品模型知识。

内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险-第2张图片

  科技媒体《The Information》获取的 Meta 内部管理规范文件显示,公司对应用 AI 工程部门的工程师使用 Anthropic 旗下 Claude 代码工具、OpenAI 旗下 Codex 模型设置了严格使用限制 。一份内部备忘录甚至要求团队暂停部分依托这两款模型开展的工作,原因是担心第三方模型的输出内容可能混入 Meta 的模型训练数据 ,文件警告,该行为或将引发 “与合作企业之间严重的升级纠纷 ”。

内部文件曝光:Meta严防员工使用Claude	、Codex,防范知识蒸馏风险-第3张图片

  背景详情

  Meta 是 Claude 代码工具的大客户之一 ,今年初公司组建应用 AI 工程团队,核心任务是迭代自研代码助手 MetaCode(前身为 DevMate),其中关键工作就是搭建高质量数据集 、设计编程测试题库 ,用于训练、评测自研代码大模型。虽然公司允许团队在部分场景使用第三方 AI 工具,但明确要求:测试题库必须由工程师自主设计,依托自身专业技术完成 ,不得直接使用 AI 生成的思路方案 。

  这份 5 月出台、目前仍在生效的内部规范显示,Meta 惧怕无意间触发知识蒸馏行为 —— 也就是借助竞品模型的输出结果来训练自家 AI 模型,该操作涉嫌违反 Claude 、Codex 的用户使用协议 。

  知识蒸馏本质上是开发者直接复用其他企业在数据、算力、研发上的巨额投入来训练自有模型 ,近些年该行为的合规争议持续发酵。

  去年 ,深度求索(DeepSeek)推出高性能大模型后引发行业热议,OpenAI 曾质疑该模型部分能力源自对其 o1 模型的知识蒸馏(深度求索后续回应称,模型预训练主要采用公开数据与经授权的第三方合规数据)。就在今年 4 月埃隆・马斯克起诉 OpenAI 的庭审中 ,马斯克旗下太空探索技术公司(SpaceX)的 AI 子公司 xAI 被迫承认,曾对 OpenAI 的模型开展过部分知识蒸馏 。

  今年 2 月,Anthropic 表示 ,在监测到多家中国 AI 企业大规模开展模型蒸馏后,公司投入大量技术手段搭建防护机制;本月,该企业指控中国电商企业阿里巴巴实施了迄今为止规模最大的 Claude 模型蒸馏攻击。在提交给美国国会的信函中 ,Anthropic 称此次攻击瞄准了 Claude 最核心的前沿能力,包括智能体推理 、软件工程、长周期复杂任务处理等,阿里巴巴暂未对此置评。

  OpenAI、Anthropic 、谷歌的 AI 模型用户协议均明确禁止:利用模型输出内容研发同类竞争产品 。

  Meta 内部文件并未出现员工违反上述协议的具体案例。Meta 官方发言人回应:“我们制定了清晰的 AI 工具使用规范 ,引导团队合规使用工具,聚焦高价值研发工作。”

  尽管暂无违规案例,但这份最新约束规范足以说明:在全力迭代 AI 产品、为巨额算力硬件投入寻求商业回报的关键阶段 ,管理层必须给员工划定清晰的使用红线 。

  全力压降 AI 研发成本

  随着 AI 相关开支急速膨胀 ,减少外部 AI 工具依赖、将大量研发工作迁移至自研工具 MetaCode 已经成为 Meta 的核心战略。根据公司近期内部备忘录,Meta 仅今年内部 AI 使用相关支出就将达到数十亿美元。在全公司大范围推广 AI 工具之后,Meta 如今通过限制员工的令牌(Token)调用额度 ,遏制成本失控上涨的趋势 。

  公司允许应用 AI 工程团队在常规工作中使用第三方 AI 工具,例如搭建工作流 、整理代码与文件、为自研 AI 工具开发自动化校验类测试基础设施,也就是规范中提到的测试脚手架搭建、方案参数校准(用于搭建 、调优模型性能评测体系)。

  即便在上述合规场景下 ,所有 AI 生成内容投入使用前必须经过人工严格审核。规范明令禁止:使用外部 AI 模型的输出来设计代码测试题库,文件中写道 “该行为意味着工程师完全丧失项目主导权,我们绝不允许测试任务的创意来源于第三方模型” 。

  另一项禁令:工程师不得借助 AI 查找源代码漏洞 ,也不能通过代码分析让 AI 产出测试任务方向 。简单来说,不能由 AI 来决定需要测试哪些业务问题。

  此外,规范要求:如果自研待测模型可以访问容器内资源 ,那么应用部署容器(封装程序 、代码、依赖库等运行环境)中,严禁放入任何 AI 生成内容。

  在合规边缘谨慎前行

  业内专家表示,科技企业在研发过程中使用竞品 AI 模型 ,相当于走钢丝:既要借力第三方模型提升效率 ,又要严防相关数据回流进自家的训练体系 。

  法学与科技行业顾问马克・莱泽评价,Meta 这份内部文件几乎完整还原了企业游走在合规红线的所有风控细节。

  尽管美国现行法律并未明令禁止知识蒸馏,AI 生成内容也不受版权法保护 ,但各大 AI 实验室普遍会直接封禁涉嫌蒸馏的企业、个人的模型调用权限。

  去年,Anthropic 就关停了 OpenAI 调用 Claude 的 API 接口权限 。OpenAI 当时解释,调用接口仅用于横向测评竞品模型的能力与安全性能 ,属于行业通用的技术基准测试手段。

  Meta 上月的备忘录提及,部分员工利用 AI 生成 、修改评测任务,导致无法界定任务创意来自人工还是第三方模型。

  Meta 收紧 Claude、Codex 使用权限 ,一方面是担忧第三方模型输出内容间接流入训练数据集,既会损害自研模型质量,也会引发合作方的合规纠纷;另一方面 ,通过暂停相关高危业务强化内部治理,让 AI 研究院、应用 AI 业务线管理层确保所有研发流程符合合规要求 。

文章推荐

  • 隔壁出现疫情/隔壁栋有人确诊了怎么办

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    1
  • 疫情塑身衣/疫情 衣服

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 【沂水疫情分布,沂水疫情分布在哪里】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 【邳州疫情查询,邳州疫情查询电话】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    1