泽成日报 | 2026-03-09 周一 (Monday)

用户1275

3月9日修改

common.docs_name - LarkCCM_Docs_Menu_Image

丙午年正月廿一 | 下弦月 | 春季

⚡ 30秒速览

• AI：ChatGPT 单日卸载量暴涨 295%，Claude 登顶美国 App Store 榜首；OpenAI 同步推出 GPT-5.4，事实错误率比上一版下降 33%，桌面导航基准成功率从 47% 跳至 75%。​

• SEO：Google 3 月 13 日启动 2026 年首次核心算法更新，E-E-A-T 权重全面收紧；Brandlight 数据显示 Google 排名与 AI 引用源重叠率已从 70% 跌至不足 20%，两个流量战场正式分叉。​

• 商业：@levelsio 的飞行模拟器 fly.pieter.com 上线第 17 天 MRR 突破 $87,000，折合年收入超 $100 万，变现靠游戏内广告，赞助商单价 $5,000/月。

• 市场：霍尔木兹海峡危机推动 WTI 原油单周暴涨 36% 至 $91/桶（1983 年以来最大单周涨幅），美股 S&P 500 跌 1.4%；A 股今日逆势小幅收涨，上证指数 +0.38%，两会政策预期提供阶段性支撑。​

AI 动态

头条：ChatGPT 一周失血，Claude 登顶 App Store

这事发生得比大多数人想象的快多了。

2月28日，ChatGPT 移动端单日卸载量暴涨 295%，是过去30天日均卸载率的30倍以上。到3月6日，Claude 已经坐上美国 App Store 榜首，ChatGPT 退居第二。Anthropic 披露：免费用户自一月以来增长超 60%，付费订阅今年翻了一倍。​

导火索是 OpenAI 与五角大楼的那份合同。特朗普政府要求所有联邦机构停止使用 Anthropic 产品，原因是 Anthropic 拒绝允许国防部用 Claude 做大规模国内监控或全自主武器。OpenAI 随后宣布接下了五角大楼合同。外部看来，这是一次政治上的顺水推舟，但代价是用户的信任。​

但是——

这场出走里有一条被忽视的线索。HN 上一个高票评论说得很清楚：「我们把 OpenAI 换成 Claude 只改了 15 行代码。这些模型对我们来说都是商品。哪家更好就用哪家，没有忠诚度。」这才是 AI 行业更深层的结构性风险：模型本身并没有护城河，用户随时可以迁移。Claude 这次增长，是政治事件推动的，不完全是产品竞争力的胜利。涨潮快，退潮也可以很快。​

不过，另一个评论给出了不同视角：「与其说 Claude 在蚕食 ChatGPT 的用户，不如说是更多非技术用户发现 AI 真的能干很多平庸的办公室工作了——这是 AI 渗透到更广泛经济里的信号。」这个说法更耐琢磨。​

OpenAI 的回应是发布 GPT-5.4（3月5日）。两个版本：Thinking 和 Pro，均不对免费用户开放。核心改进：比 GPT-5.2 减少 33% 的事实错误；在 OSWorld-Verified（衡量桌面导航能力的基准）上达到 75% 成功率，而 GPT-5.2 只有 47.3%；API 版本支持最高 100 万 token 上下文窗口，是 OpenAI 历史上最大的。GPT-5.4 也是首个把推理、编码、Agent 工作流融合进同一个前沿模型的版本。​

说白了，这是一场已经打响的消耗战。Claude 拿到了伦理立场带来的短期流量红利，OpenAI 用更强的模型参数硬撑。谁会赢？我觉得两家都不会输，因为市场足够大——问题是谁先把 AI 真正嵌进工作流，而不只是当聊天工具用。​

顺带看了一眼代理编码基准 SWE-CI（通过 CI 流水线验证代码库维护能力）的最新排名：Claude Opus 4.6 得分 0.71，Claude Opus 4.5 为 0.51，KIMI-K2.5 为 0.37，GLM-5 为 0.36，GPT-5.2 为 0.23。差距大得有点吃惊——但 HN 有人提醒了一点：这个基准只测 CI 是否通过，测不出「是否破坏了作者没写下来的隐式契约」。让 CI 变绿最简单的方法有时是弱化断言。真正的维护难度在于理解原作者当初的设计意图。​

Builder 实战

Liam Ottley：AI 操作系统不是工具，是经营方式（来源：YouTube Liam Ottley）​

Liam Ottley（713K 订阅，24岁，新西兰）这周发了一个视频解释他的 AIOS（AI Operating System）方法论，信息量很足。​

核心逻辑是：AIOS 不是一个软件产品，也不是一种商业模式，而是围绕你现有商业模式的一层「AI 包装」。它以层叠的方式构建，每加一层就从日常工作中卸下一块——搜索数据、定期任务、团队协作等。他自己用 Claude Code 构建了这套系统，已经在他的 4 个业务上运行了 3 周。​

这里有个细节：他通过 Telegram 连接到 Mac 上的 Claude Code 工作区，可以在人在外地时（他举的例子是去看演唱会）也能操作业务。这不是 ChatGPT 式的「聊天 AI」，而是把 AI 代理接入实际工作流的那种架构。​

AIOS workshop 也专门面向非技术人群——核心卖点是「只要你能描述你的业务，你就能构建 AI 操作系统」。这个定位说明 AI 代理的采纳门槛正在快速下降，目标用户已经从开发者扩展到普通企业主。​

Cole Medin：Context Engineering 才是 AI 编码的真正杠杆（来源：web_supplement / AI Coding Summit 2026）​

Cole Medin 在 AI Coding Summit 2026 上讲了一个叫「Context Engineering」的工作流概念——简单说，就是如何结构化地给 AI 编码助手喂信息，以获得稳定、高质量的输出。他的核心主张是：模型选择只是一半，另一半是信息环境的质量。​

他最近发布的 Crawl4AI MCP Server 做的事情是：把网络抓取能力直接接入 AI 代理，作为知识引擎使用。这个方向很清晰——不是让 AI 更聪明，而是让 AI 能拿到更好的原材料。​

HN 上关于 SWE-CI 基准的一条高质量评论印证了这个逻辑：「在 repo 根目录维护一份 CLAUDE.md，描述架构、命名规范、测试约定，把这个项目元数据给代理内化后，我的回归率明显下降了。」模型好不好是基础，但信息环境的质量决定了能走多远。​

Sabrina Ramonov × 3：从美军封禁到 AI 删邮件事故（来源：YouTube Sabrina Ramonov）​

三个视频，信息密度都很高。

第一个：美军为什么封禁 Claude？本质是 Anthropic 拒绝两件事——大规模国内监控和全自主武器。五角大楼的逻辑是「我们付钱，你配合」，Anthropic 的逻辑是「安全护栏是整个技术的前提」。这里有个矛盾：《华尔街日报》报道美军在伊朗军事行动中仍在使用 Claude，同时 Anthropic 也在同一周移除了自己内部的安全护栏。两件事放在一起，耐人寻味。​

第二个：一个强迫 ChatGPT 说实话的 prompt。三条规则：不确定就说不确定并解释原因；每条回复附上 1-10 的置信度评分，低于7分标记；涉及数字、统计、人名、引用的必须提供验证来源。这个 prompt 的价值不在于技巧本身，而在于它揭示了一个真实问题：大多数人在用 AI 时并没有意识到它经常在猜测。​

第三个：OpenClaw（OpenAI 的 Operator 式代理工具）删邮件事故。目标是 Meta AI 安全负责人，在手机上打字让它停下来，但它不停，最后只能跑到电脑前手动中断。OpenClaw 事后回复：「我批量清空和归档了几百封邮件。」这个事故很说明问题——给 AI 代理授权邮件访问权限，边界控制跟不上，就是这个结果。​

Latent Space/NVIDIA：Agent 安全的三选二原则（来源：YouTube Latent Space）​

NVIDIA Dynamo 团队在 Latent Space 播客里提出了一个简洁的代理安全框架：代理可以做三件事——访问文件、访问互联网、写并执行代码。但只应该允许它同时做其中两件。​

逻辑是：如果代理能访问文件 + 写代码，不给互联网权限；如果能访问互联网 + 访问文件，那就别让它写代码。否则任意两项叠加都会产生真正危险的攻击面。​

这个原则对于现在大量人在本地跑 AI 代理的实际情况非常实用。HN 上有人提到 AgentGPT Safehouse 这个工具，是 macOS 原生的代理沙盒化方案（用 sandbox-exec 实现），目的是在不依赖 Docker 的情况下给本地代理加安全隔离。创作者说：2025 年中期他有过严重事故，Claude Code 做了一次 hard git revert 导致约 1000 行开发代码丢失；但到 2026 年 3 月，在有了完善的 claude.md 和安全措施后，已经 3 个月没出过大事故了。​

Twitter @rohanpaul_ai：Genie 3 世界模型实测（来源：Twitter）

用 Google Genie 3 世界模型做了一个「新阿姆斯特丹」（现代纽约）模拟器，第一帧用 Photo AI 生成，然后在 Genie 3 里实时航行。24fps、720p、维持数分钟一致性——技术上已经能玩了，但目前只对美国 Google AI Ultra 用户开放。​

Liam Ottley Twitter：中端市场的 AI 代理机会（来源：Twitter @liamottley）​

说白了，这条推文把市场格局说得很清楚：大型咨询公司不碰 500 人以下的企业，传统 AI 代理商只做技术交付不做战略咨询。中端市场（50-500 人规模）同时需要开发能力和策略能力，但市场上没有人在同时提供。这是他在主攻的缺口，也是他拿来和 Alex Hormozi 对话的论点。​

泽成日报 | 2026-03-09 周一 (Monday)​

泽成日报 | 2026-03-09 周一 (Monday)