~/ai-stream
~/large-models/openai-spud-dethrones-claude-on-the-frontier-20260424
The Rundown AI·大模型

OpenAI 'Spud' 重夺前沿王座,Claude 退居次席

content

OpenAI GPT-5.5 Spud

🥔OpenAI 以 GPT-5.5 重夺前沿领先地位

OpenAI 正式发布 GPT-5.5(内部代号 'Spud'),这款被官方定位为全新智能级别的模型在多项行业基准测试中创下新高,一举超越 Anthropic 重新夺回前沿模型的话语权。

  • 在推理、Agent 能力、计算机使用与编程等公开模型测试中全面领跑,部分得分已接近 Claude Mythos
  • 保持与 5.4 相同的响应速度,同时通过效率优化提升整体性能;OpenAI 称团队甚至用 Codex 和 5.5 重写了自身 GPU 代码以优化基础设施
  • API 定价为输入 $5 / 输出 $30 每百万 token,官方宣称仅为同类前沿编程模型成本的一半
  • 已全面接入 ChatGPT 各层级套餐及 Codex 的 Thinking 与 Pro 版本,新发布版本均附带慷慨用量策略

划重点: Anthropic 独领风骚数月后,OpenAI 以密集且强劲的产品迭代重新点燃了市场热情,而 Claude 近期正面临速率限制与质量下滑的投诉,竞争格局再度逆转。

白宫备忘录

美国指控中国实验室工业级 AI 模型蒸馏窃取

白宫发布备忘录,指责中国公司通过数千个虚假 API 账户和越狱攻击,对美国前沿 AI 实验室实施工业级模型蒸馏窃取。

  • 模型蒸馏指用前沿模型输出训练小型 AI 系统,美官员称中国通过数千个虚假 API 账户和越狱攻击实施大规模蒸馏
  • Anthropic 曾于 2 月指控 DeepSeek、月之暗面和 MiniMax 涉嫌蒸馏,此次白宫备忘录将私人投诉升级为联邦政策层面
  • 中国大使馆驳斥相关指控为纯粹诽谤
  • 美国众议院外交事务委员会一项法案本周通过首轮投票,将推动政府把蒸馏违规者列入美国出口黑名单

划重点: Kratsios 备忘录重新框定了中美 AI 差距的来源,认为中国的进步主要来自数据窃取而非自主架构创新,但这一说法是否成立仍有待观察。

Claude 晨报教程

📰用 Claude 打造你的专属晨报

这份教程展示了如何将 Claude 变成你的私人报纸编辑,自动整合 Slack、Notion、Gmail 和日历中的信息,按重要性排序并生成报纸格式的摘要。

  • 连接 Slack、Notion、Gmail 和日历作为信息来源
  • 用提示词让 Claude 按报纸格式整理过去 24 小时的重要信息
  • 将满意的工作流保存为 Claude 技能并设置每日定时运行

划重点: 当 AI 代理能够自动收集信息、编辑排版并定时交付,个人知识工作流正从手动整理走向全自动编排。

Anthropic 调研

📊AI 最大受益者也是最焦虑的人

Anthropic 发布基于 8 万多名 Claude 用户调研的经济学报告,发现从 AI 中获得最大生产力提升的人恰恰也是最担心被 AI 取代的群体,尤其是早期职业员工。

  • 高频使用 Claude 的工作者对 AI 替代的恐惧是低频用户的 3 倍,工程师群体焦虑感最突出
  • 多数受访者称 AI 收益体现在任务加速和空闲时间增加,但也导致工作范围扩大
  • 早期职业受访者表达了最强烈的替代恐惧,与 Anthropic 此前发出的美国应届生招聘放缓信号相互印证

划重点: 传统观点认为 AI 恐慌来自低层级采用者,但调研结果颠覆了这一认知——焦虑恰恰来自从 AI 中获益最多的重度用户,且短期内看不到缓解的有效方案。