AI Agent 精选

追踪 AI Agent 领域的前沿动态、框架对比、实战经验。从 MCP 协议到 Agent 编排，帮你构建系统化的 Agent 认知。

文章列表

Anthropic 把 Claude 当产品来养：比 AI“做梦”更重要的，是下一代模型开始学“为什么” — 真正值得关注的不是 Claude 会不会“做梦”，而是 Anthropic 正在把模型训练从“喂更多数据”升级成“先定义规格、再训练判断、最后维护长期记忆”的完整产品流水线
Gemini Omni：谷歌用「世界模型」填了 Sora 的坑，顺手把视频生成的天花板掀了 — 教授在黑板上推导正确的数学证明、弹珠物理轨迹完全合理——Omni 不是生成视频，是推理现实
腾讯混元开源 Chronicles-OCR：让 GPT-5 认不得甲骨文的基准，才是好基准 — 业界首个覆盖汉字七体演化的古文字感知基准，28 个主流模型最高识别率仅 27.1%
5 天 vs 5 年：Claude Mythos 如何击穿 Apple M5 的硬件防线 — 三人小队 × AI = 5 天绕过苹果 5 年数十亿美元打造的 MIE 内存安全系统。从普通用户到 root shell，AI 正在重写安全攻防的时间公式
SANA-WM：NVIDIA 用 26 亿参数造了一分钟的世界，然后开源了 — 一张图片 + 一条相机轨迹 = 720p、一分钟长的可控视频。2.6B 参数、64 张 H100 训练 15 天、推理单卡搞定。开源世界模型第一次在效率上碾压工业基线
guizang-ppt-skill：一个人把十年审美压缩进了一个 Skill 文件 — 8230 Star、48 小时爆火，歸藏把十年设计经验写进一个 SKILL.md。不是模板，是 Agent 能执行的审美纪律
Codex 进了你的口袋：OpenAI 把 AI Agent 的战场搬到了手机上 — 不是在手机上写代码，是把代码世界装进口袋。400 万周活用户、免费版也能用、secure relay 跨设备同步——OpenAI 在布一个「超级 App」的局
腾讯开源 Agent Memory：符号化短期记忆 + 分层长期记忆，Token 省 61% — 不是存更多，是存更聪明。Mermaid 画布替代过程日志、L0-L3 四层记忆金字塔、白盒可调试——腾讯云数据库团队开源了一套让 Agent 真正"记住你"的记忆系统
MiMo V2.5 Pro 登顶 DesignArena 开源前三 — 小米的大模型在前端编码上追平 Claude Sonnet 4.6，开源第三，MIT 协议，Token 效率高 40-60%。手机厂造的大模型，为什么让硅谷坐不住了
AI Native 时代，研发组织何去何从？ — 工程师写代码时间从 30% 降到 5%，编码效率 10 倍但交付只提升 2 到 3 倍。当 AI 能写代码之后，研发组织到底是为什么存在的？
Codex 钻进浏览器了：400 万周活用户、8 倍增长，OpenAI 在布什么局？ — Chrome 扩展让 AI Agent 直接用你的登录态操作网站，后台并行，不抢浏览器。三层工具体系 + 逐站授权，Codex 在做一件更大的事
福耀科技大学新增 5 个专业：50 个学生、8 亿预算，曹德旺在下一盘什么棋？ — 未来机器人、人工智能等 5 个新兴本科专业获批，曹德旺的"产业大学"用反常识的操作试探中国高等教育的边界
HappyHorse：阿里用一头「快乐小马」重新定义了 AI 视频生成 — 匿名登顶、音画同生、开源商用许可，阿里如何用架构级的差异化在 AI 视频赛道打出"产品化优先"的牌
DeepSeek 融资 500 亿：梁文锋自己出 200 亿，图的到底是什么？ — 创始人个人出资 40%、21 天估值翻 5 倍、不差钱却创纪录融资——这轮融资买的不是算力，是人才结构的安全
16 小时自主作战：Claude Mythos 为什么强到不敢发布 — METR 评估显示 Mythos 自主工作时距达 16 小时，AI Agent 的能力边界正在被重新定义
百度 ERNIE 5.1：用 6% 的训练成本，打了场什么仗 — 参数压缩 1/3、成本降到 6%，百度如何用工程思维打大模型效率战
OpenCove：让 AI Agent 从黑箱变成白箱的空间化工作台 — 用无限画布打破 Agent 工作流的黑箱，让 Claude Code、终端、任务同屏可见
StepAudio 2.5 TTS：盲测全球前三，中国语音模型第一次站上这个位置 — 语境感知语音合成，3秒克隆音色，用自然语言控制情绪——TTS从念稿子到表演
OpenRouter Pareto Code：一个参数解决「选模型焦虑症」 — 不选模型、设阈值，一个 min_coding_score 让 AI 自动挑选当前最强的编码模型——路由层正在变成 AI 基础设施的关键组件
ChatGPT 被起诉"教唆杀人"：2026 年 AI 行业最大的那只黑天鹅 — 佛州总检察长启动首次 AI 刑事调查，受害者家属正式起诉 OpenAI。如果屏幕另一端是真人，检方说会以谋杀罪起诉
一个视图管理所有 Agent 会话，Claude Code 的"智能体视图"在解决什么真问题？ — 当 Agent 能独立工作时，用户和工具的关系就从"对话"变成了"协作"。Agent View 解决了并发会话管理的认知负担问题
宇树 GD01：390 万的载人变形机甲，不是科幻预告片，是发货通知 — 全球首款量产载人机甲、双模变形、一拳锤倒砖墙。不是技术秀，是产品节奏——从 2.69 万的双臂机器人到 390 万的载人机甲，宇树在定义一个品类
工信部 AI 伦理审查先导计划启动：做 AI 产品的人，该关心什么 — 10 省份、9 领域、20+ 家企业、5 项以上标准——工信部 AI 伦理审查从纸面到地面，独立开发者现在该做什么
Codex 学会了用你的电脑：Computer Use 把 AI Agent 从代码框拖到了整个桌面 — 独立光标、双模态架构、逐应用授权——OpenAI 给 Codex 加的 Computer Use 不是屏幕自动化工具，而是重新定义 AI Agent 的行动空间
吴恩达：AI 不会带来"失业末日"，而是一场"就业狂欢" — "AI 就业末日"叙事背后是 AI 实验室、SaaS 定价和企业公关的利益共谋。吴恩达用数据和历史证明：杰文斯悖论才是 AI 时代就业的底层逻辑
Kimi WebBridge：一个浏览器扩展，让所有 AI Agent 共用同一双"真手" — 不是又一个独占的 AI 浏览器插件，Kimi 给 Claude Code、Cursor、Codex、Hermes、OpenClaw 等等搭了同一座桥。装上扩展，所有 Agent 都能用你浏览器的登录态干活

AI Agent 精选 ​

文章列表 ​

AI Agent 精选

文章列表