GPT-5.6 发布了,但你用不了

这周,OpenAI 发布了 GPT-5.6 Sol——Terminal-Bench 2.1 编程跑分 91.9%,超过仅当了 17 天榜首的 Claude Mythos 5。

但你用不了。

Sol 目前只向约 20 家美国政府批准的”可信合作伙伴”开放。普通用户短期内无缘体验。

同一天,Anthropic 的 Claude Mythos 5 在被封杀两周后终于解禁——但也只是向超过 100 家美国机构开放。Fable 5 仍未解禁。


两周前,美国商务部以”国家安全”为由一刀切封杀 Fable 5 和 Mythos 5——连 Anthropic 内部外籍员工都无法使用自家模型。现在政府转变为”分级许可、逐一审批”:商务部部长 Lutnick 写信确认”适当的保护措施已经到位”,允许有限开放。

这不是放松。是更精细的控制

一刀切封杀是恐慌反应,分级许可是制度设计。政府正在学会用”许可证”而非”铁幕”来管理前沿 AI。


一个值得警惕的数据

这周 Import AI 报道了一项 Oxford/Stanford 联合研究:18,978 次对话、6,923 名参与者,AI 在文字说服力上全面超越人类专家。即便对方经过专业训练并有金钱激励,AI 仍然赢了。在真实募款场景中,AI 的效果是专业募款人员的近 3 倍。

AI 的优势源于更快速地输出更大量的信息——一旦限制速度和字数,差距消失。但这恰恰是政府最担心的:说服力最强的 AI,如果被外国用户使用,就可能变成一种超越任何人类专家的社会影响力

封杀不是技术决策。是政治决策。


AI 的竞争维度已经变了

过去两年我们比的是谁的模型更强、谁的 benchmark 更高。现在比的是谁被允许使用最强的模型。GPT-5.6 Sol 你用不了,Mythos 5 你用不了,Fable 5 你更用不了——不是因为它们不够好,是因为政府不让你用。

这对做 AI 产品的人来说,意味着技术选型从此多了一个维度:这个模型会不会被封杀?

GLM-5.2 和 Kimi K2.7 Code 在 Fable 5 封杀窗口期内快速补位,不是偶然,是中国开源生态的应急能力。OpenAI 把 GPT-5.6 分成 Sol/Terra/Luna 三档产品、把分层安全做进架构里——这是把合规当成产品功能来设计。Anthropic 在 X 上说”继续与政府合作”——这是把政策博弈当成运营常态来应对。

AI 的许可证时代不是暂时的,是长期的。 政府已经学会了精细管控,不会退回”随便用”的状态。


三个建议行动

  1. 建立模型 fallback 机制
    为每个关键场景建立”首选→备选→兜底”三级路由表。首选海外前沿模型,备选国产开源(GLM-5.2、Kimi K2.7),兜底自有部署。这不是建议,是生存必需。

  2. 把合规做成产品功能
    参考 OpenAI 的分层安全体系:模型内置拒答、实时分类器、账户级风险审查。合规不是事后补丁,是产品架构的一部分。

  3. 关注模型编排路线
    Sakana Fugu 用多 Agent 编排达到 Fable 5 级性能,不做最强模型做最聪明的调度器。这是在许可证时代最务实的路径:不被单一模型绑死,用编排和路由分散风险。


五周了。从 GLM-5.2 开源逆袭到 Cursor SpaceX 合并,从 OpenAI 全栈化到 AI 经济成本外溢,再到这周的许可证时代。叙事线很清晰:AI 正在从技术竞赛进入产业重构,从产业重构进入社会影响,从社会影响进入政治博弈。

每一步都比上一步离普通人更近。

别只盯着模型排行榜了。看看你的架构,经得起下一轮封杀吗?