AI Agent 精选
追踪 AI Agent 领域的前沿动态、框架对比、实战经验。从 MCP 协议到 Agent 编排,帮你构建系统化的 Agent 认知。
文章列表
Anthropic 把 Claude 当产品来养:比 AI“做梦”更重要的,是下一代模型开始学“为什么” — 真正值得关注的不是 Claude 会不会“做梦”,而是 Anthropic 正在把模型训练从“喂更多数据”升级成“先定义规格、再训练判断、最后维护长期记忆”的完整产品流水线
Gemini Omni:谷歌用「世界模型」填了 Sora 的坑,顺手把视频生成的天花板掀了 — 教授在黑板上推导正确的数学证明、弹珠物理轨迹完全合理——Omni 不是生成视频,是推理现实
腾讯混元开源 Chronicles-OCR:让 GPT-5 认不得甲骨文的基准,才是好基准 — 业界首个覆盖汉字七体演化的古文字感知基准,28 个主流模型最高识别率仅 27.1%
5 天 vs 5 年:Claude Mythos 如何击穿 Apple M5 的硬件防线 — 三人小队 × AI = 5 天绕过苹果 5 年数十亿美元打造的 MIE 内存安全系统。从普通用户到 root shell,AI 正在重写安全攻防的时间公式
SANA-WM:NVIDIA 用 26 亿参数造了一分钟的世界,然后开源了 — 一张图片 + 一条相机轨迹 = 720p、一分钟长的可控视频。2.6B 参数、64 张 H100 训练 15 天、推理单卡搞定。开源世界模型第一次在效率上碾压工业基线
guizang-ppt-skill:一个人把十年审美压缩进了一个 Skill 文件 — 8230 Star、48 小时爆火,歸藏把十年设计经验写进一个 SKILL.md。不是模板,是 Agent 能执行的审美纪律
Codex 进了你的口袋:OpenAI 把 AI Agent 的战场搬到了手机上 — 不是在手机上写代码,是把代码世界装进口袋。400 万周活用户、免费版也能用、secure relay 跨设备同步——OpenAI 在布一个「超级 App」的局
腾讯开源 Agent Memory:符号化短期记忆 + 分层长期记忆,Token 省 61% — 不是存更多,是存更聪明。Mermaid 画布替代过程日志、L0-L3 四层记忆金字塔、白盒可调试——腾讯云数据库团队开源了一套让 Agent 真正"记住你"的记忆系统
MiMo V2.5 Pro 登顶 DesignArena 开源前三 — 小米的大模型在前端编码上追平 Claude Sonnet 4.6,开源第三,MIT 协议,Token 效率高 40-60%。手机厂造的大模型,为什么让硅谷坐不住了
AI Native 时代,研发组织何去何从? — 工程师写代码时间从 30% 降到 5%,编码效率 10 倍但交付只提升 2 到 3 倍。当 AI 能写代码之后,研发组织到底是为什么存在的?
Codex 钻进浏览器了:400 万周活用户、8 倍增长,OpenAI 在布什么局? — Chrome 扩展让 AI Agent 直接用你的登录态操作网站,后台并行,不抢浏览器。三层工具体系 + 逐站授权,Codex 在做一件更大的事
福耀科技大学新增 5 个专业:50 个学生、8 亿预算,曹德旺在下一盘什么棋? — 未来机器人、人工智能等 5 个新兴本科专业获批,曹德旺的"产业大学"用反常识的操作试探中国高等教育的边界
HappyHorse:阿里用一头「快乐小马」重新定义了 AI 视频生成 — 匿名登顶、音画同生、开源商用许可,阿里如何用架构级的差异化在 AI 视频赛道打出"产品化优先"的牌
DeepSeek 融资 500 亿:梁文锋自己出 200 亿,图的到底是什么? — 创始人个人出资 40%、21 天估值翻 5 倍、不差钱却创纪录融资——这轮融资买的不是算力,是人才结构的安全
16 小时自主作战:Claude Mythos 为什么强到不敢发布 — METR 评估显示 Mythos 自主工作时距达 16 小时,AI Agent 的能力边界正在被重新定义
百度 ERNIE 5.1:用 6% 的训练成本,打了场什么仗 — 参数压缩 1/3、成本降到 6%,百度如何用工程思维打大模型效率战
OpenCove:让 AI Agent 从黑箱变成白箱的空间化工作台 — 用无限画布打破 Agent 工作流的黑箱,让 Claude Code、终端、任务同屏可见
StepAudio 2.5 TTS:盲测全球前三,中国语音模型第一次站上这个位置 — 语境感知语音合成,3秒克隆音色,用自然语言控制情绪——TTS从念稿子到表演
OpenRouter Pareto Code:一个参数解决「选模型焦虑症」 — 不选模型、设阈值,一个 min_coding_score 让 AI 自动挑选当前最强的编码模型——路由层正在变成 AI 基础设施的关键组件
ChatGPT 被起诉"教唆杀人":2026 年 AI 行业最大的那只黑天鹅 — 佛州总检察长启动首次 AI 刑事调查,受害者家属正式起诉 OpenAI。如果屏幕另一端是真人,检方说会以谋杀罪起诉
一个视图管理所有 Agent 会话,Claude Code 的"智能体视图"在解决什么真问题? — 当 Agent 能独立工作时,用户和工具的关系就从"对话"变成了"协作"。Agent View 解决了并发会话管理的认知负担问题
宇树 GD01:390 万的载人变形机甲,不是科幻预告片,是发货通知 — 全球首款量产载人机甲、双模变形、一拳锤倒砖墙。不是技术秀,是产品节奏——从 2.69 万的双臂机器人到 390 万的载人机甲,宇树在定义一个品类
工信部 AI 伦理审查先导计划启动:做 AI 产品的人,该关心什么 — 10 省份、9 领域、20+ 家企业、5 项以上标准——工信部 AI 伦理审查从纸面到地面,独立开发者现在该做什么
Codex 学会了用你的电脑:Computer Use 把 AI Agent 从代码框拖到了整个桌面 — 独立光标、双模态架构、逐应用授权——OpenAI 给 Codex 加的 Computer Use 不是屏幕自动化工具,而是重新定义 AI Agent 的行动空间
吴恩达:AI 不会带来"失业末日",而是一场"就业狂欢" — "AI 就业末日"叙事背后是 AI 实验室、SaaS 定价和企业公关的利益共谋。吴恩达用数据和历史证明:杰文斯悖论才是 AI 时代就业的底层逻辑
Kimi WebBridge:一个浏览器扩展,让所有 AI Agent 共用同一双"真手" — 不是又一个独占的 AI 浏览器插件,Kimi 给 Claude Code、Cursor、Codex、Hermes、OpenClaw 等等搭了同一座桥。装上扩展,所有 Agent 都能用你浏览器的登录态干活
