2026-02-25 日报
今日一句话 Qwen3.5 悄悄发了,CLI 是 agent 的天然主场,今天信息密度不低。
今日精选(3 条)
1. Qwen3.5 系列发布:122B-A10B 和 35B-A3B 同时上线
🛠️ 选这条:MoE 架构,激活参数只有总参数的 1/12,本地跑大模型的成本直接打下来了。
122B-A10B 的 benchmark 社区反馈是对标 GPT-5 High 水平,35B-A3B 在 27B 密集模型的显存里跑出接近 70B 的效果。对本地部署党来说这是今天最值得动手的事——如果你现在还在用 Qwen3-32B 做本地推理,可以直接切 35B-A3B 试试,激活参数更少、速度更快。编码任务社区有人做了 Qwen3-Coder-Next vs Qwen3.5-35B-A3B 的对比,35B-A3B 在代码任务上表现不差。唯一要注意的是 MoE 模型对推理框架有要求,确认你的 llama.cpp 或 vLLM 版本支持再下载,别踩版本坑。
2. Karpathy:CLI 是 AI agent 的天然主场
@karpathy · 推文
🧠 选这条:5800+ 点赞说明这个判断戳到了很多工程师,值得认真想一下。
Karpathy 的核心论点是:CLI 是"遗留技术",所以 AI agent 能原生操作它——文档完整、行为确定、没有 UI 状态管理的麻烦。这对 agent 架构选型有直接影响:如果你在纠结给 agent 接 GUI 还是 CLI,答案基本是 CLI 优先。Claude Code、Cursor 这类工具能跑起来,底层逻辑就是这个。实践建议:你现在构建的 agent 如果有"操作某个系统"的需求,先找这个系统的 CLI 接口,没有就找 API,GUI 自动化是最后的选项,维护成本高且脆。
3. 🧠 Prompt 重复对 agent 工程任务无效(n=20 盲评)
r/MachineLearning · 帖子
🧠 选这条:这个"民间实验"直接否定了一个流传很广的 prompt 技巧,值得认真对待。
"重复关键指令能提升模型遵从率"这个说法在 prompt 工程圈子里流传很久了。这个实验在 agentic 工程任务上做了 20 组盲评,结论是 null result——重复没有显著效果。样本量不大,但方向是对的:agent 任务和单次问答不一样,模型在多步执行中的注意力分布不同,简单重复 prompt 不等于强化约束。如果你现在还在靠"在 system prompt 里重复三遍"来保证 agent 行为,这个时间花在结构化输出约束或者 tool schema 设计上回报更高。
本周趋势
Qwen3.5 的发布节奏说明开源 MoE 这条路现在跑得很顺——每隔几周就有新的性价比拐点出现。对开发者来说,现在的策略应该是:本地/私有部署优先考虑 MoE 架构模型,不要再用密集模型的显存预算去规划了。
Agent 方向,Karpathy 的 CLI 论点 + 91k 生产 agent 交互数据显示 tool-chaining 占比在上升,这两个信号指向同一件事:agent 的核心能力正在从"生成文本"转向"可靠调用工具链"。现在值得投入的是:工具调用的可靠性、错误恢复逻辑、以及 CLI/API 接口的封装质量。
避开的方向:GUI 自动化 agent(维护地狱)、靠 prompt 技巧堆可靠性(治标不治本)。
今日噪音
dontbesilent 今天发了一堆创业感悟和表情包,互动不低但对你的技术决策没有任何帮助,跳过。
暂无命中内容
暂无内容
暂无命中内容
暂无内容
暂无命中内容
暂无内容