五角大楼计划让AI公司在机密数据上训练，这意味着什么？

Thu, 26 Mar 2026 16:00:00 +0800

MIT Technology Review上周爆出一条大料：美国国防部正在和OpenAI、Anthropic等AI公司讨论，计划建立安全环境，允许这些公司直接在机密数据上训练定制模型。

这条新闻出来后，圈内讨论挺热烈的。有人说这是AI军事化的里程碑，有人担心安全风险hold不住。我们来拆解一下这件事到底意味着什么。

现状：AI已经进了机密环境，但还不能"学习"

现在的情况其实你可能没想到：GPT和Claude这类商用模型早就用在五角大楼了。比如Anthropic的Claude Gov已经在帮美军分析伊朗目标的情报了。

但目前有个关键限制：模型只能用机密数据回答问题，不能从这些数据中学习。也就是说，你可以把机密文档喂给模型让它总结，但训练过程还是只能在非机密数据上做。

这次讨论的就是要打破这个限制——允许模型直接在机密数据上做微调甚至全参数训练。

原因其实很直接：需求摆在那了。

美军喊出"AI优先"的作战转型口号后，对更强大模型的需求越来越迫切。现在模型虽然能用，但在特定任务上准确率不够——比如识别特殊地形的目标，解读密语编码的情报，这些都得用真实数据训练才能提上来。

一位匿名的国防官员确认，OpenAI和xAI都已经拿到合同，模型都进了机密环境，现在就差训练这一步。做成了，特定任务的准确率会提升非常明显。

打个比方，美军无人机一天能拍几十万张照片，靠人根本看不完。AI能帮忙找目标，但模型要是没见过真实战区长什么样，误报率就下不来。用真实数据训练一遍，误报能少一大截。

这件事最大的风险谁都能想到：模型训练的时候会不会把敏感数据记住，然后在别的对话中一不小心泄露出来？

说实话，这个问题现在没有完美答案。

比如训练数据里有一份情报人员的报告，模型把这个信息学进参数里了。后来别的部门用这个模型问答，问到相关问题，模型直接就说漏嘴了。不同密级部门要是共用模型，这种风险真的防不胜防。

按照现在透出来的方案，训练会在认证过的安全数据中心里做，数据还是国防部的。只有极少数AI公司人员拿到安全许可才能接触数据。但就算这样，训练完模型后数据会不会在参数里"残留"，现在谁也说不准。

这本来就是大模型技术的原生问题：你没法精准控制模型记住了什么，没记住什么。脱敏处理能挡一些简单的提取攻击，但没法保证100%干净。

其实美军用AI训练机密数据早就有先例了。比如国家地理空间情报局（NGA）之前就给创业公司发了7.08亿美元的合同，让他们用卫星影像训练计算机视觉模型，帮着找目标。

但那次都是传统CV模型，不是现在这种大语言模型。传统CV模型训练完了，推理的时候参数里不太容易还原出原始训练数据——而大语言模型不一样，现在已经有很多研究证明，你可以通过提示工程从模型参数里榨出训练数据里的原文。

所以风险等级完全不一样。之前是图像数据训练，现在是文字情报、对话记录、甚至人员信息训练，后果严重多了。

我看到很多评论说这就是"AI军事化"，要出大事了。但换个角度看，技术发展到现在，这一步其实早晚要走。

AI在情报分析、目标识别这些场景确实能大幅提升效率。美军现在前线的情报处理压力很大，人手不够，不用AI真顶不住。但要让AI好用，就必须给它看真实数据——这是绕不开的逻辑。

问题就是安全和能力怎么平衡。现在来看，可能的方向是：

但这些都是管理手段，技术上的根本风险还是存在。现在谁也给不出打包票的解决方案——整个行业都还在摸索。

这事说到底是美军自己的转型，但对整个AI行业都有影响。

OpenAI、Anthropic能拿到国防部合同，接触机密数据，意味着这些公司和政府的绑定会越来越深。以后所谓纯商业公司的技术中立性，恐怕会越来越让人怀疑。

更重要的是，这事给所有做行业大模型的人敲了个警钟：数据隐私和模型安全，真的是悬在头上的一把剑。你帮企业训练定制模型，要是敏感数据从模型里漏出去了，这个责任谁扛得住？

现在很多企业都在把私有数据喂给大模型做微调，训自己的定制模型。大部分人其实没想明白：如果模型记住了敏感数据，怎么防提取？怎么防泄露？

五角大楼这事把这个问题直接摆到台面上了。技术跑得太快，规则和安全技术还没跟上——这就是我们现在的处境。