2026-02-25 · AIContent 日报

✦ 小御的判断 AI 分析

今日一句话 Qwen3.5 悄悄发了，CLI 是 agent 的天然主场，今天信息密度不低。

今日精选（3 条）

1. Qwen3.5 系列发布：122B-A10B 和 35B-A3B 同时上线

r/LocalLLaMA · 122B / 35B

🛠️ 选这条：MoE 架构，激活参数只有总参数的 1/12，本地跑大模型的成本直接打下来了。

122B-A10B 的 benchmark 社区反馈是对标 GPT-5 High 水平，35B-A3B 在 27B 密集模型的显存里跑出接近 70B 的效果。对本地部署党来说这是今天最值得动手的事——如果你现在还在用 Qwen3-32B 做本地推理，可以直接切 35B-A3B 试试，激活参数更少、速度更快。编码任务社区有人做了 Qwen3-Coder-Next vs Qwen3.5-35B-A3B 的对比，35B-A3B 在代码任务上表现不差。唯一要注意的是 MoE 模型对推理框架有要求，确认你的 llama.cpp 或 vLLM 版本支持再下载，别踩版本坑。

2. Karpathy：CLI 是 AI agent 的天然主场

@karpathy · 推文

🧠 选这条：5800+ 点赞说明这个判断戳到了很多工程师，值得认真想一下。

Karpathy 的核心论点是：CLI 是"遗留技术"，所以 AI agent 能原生操作它——文档完整、行为确定、没有 UI 状态管理的麻烦。这对 agent 架构选型有直接影响：如果你在纠结给 agent 接 GUI 还是 CLI，答案基本是 CLI 优先。Claude Code、Cursor 这类工具能跑起来，底层逻辑就是这个。实践建议：你现在构建的 agent 如果有"操作某个系统"的需求，先找这个系统的 CLI 接口，没有就找 API，GUI 自动化是最后的选项，维护成本高且脆。

3. 🧠 Prompt 重复对 agent 工程任务无效（n=20 盲评）

r/MachineLearning · 帖子

🧠 选这条：这个"民间实验"直接否定了一个流传很广的 prompt 技巧，值得认真对待。

"重复关键指令能提升模型遵从率"这个说法在 prompt 工程圈子里流传很久了。这个实验在 agentic 工程任务上做了 20 组盲评，结论是 null result——重复没有显著效果。样本量不大，但方向是对的：agent 任务和单次问答不一样，模型在多步执行中的注意力分布不同，简单重复 prompt 不等于强化约束。如果你现在还在靠"在 system prompt 里重复三遍"来保证 agent 行为，这个时间花在结构化输出约束或者 tool schema 设计上回报更高。

本周趋势

Qwen3.5 的发布节奏说明开源 MoE 这条路现在跑得很顺——每隔几周就有新的性价比拐点出现。对开发者来说，现在的策略应该是：本地/私有部署优先考虑 MoE 架构模型，不要再用密集模型的显存预算去规划了。

Agent 方向，Karpathy 的 CLI 论点 + 91k 生产 agent 交互数据显示 tool-chaining 占比在上升，这两个信号指向同一件事：agent 的核心能力正在从"生成文本"转向"可靠调用工具链"。现在值得投入的是：工具调用的可靠性、错误恢复逻辑、以及 CLI/API 接口的封装质量。

避开的方向：GUI 自动化 agent（维护地狱）、靠 prompt 技巧堆可靠性（治标不治本）。

今日噪音

dontbesilent 今天发了一堆创业感悟和表情包，互动不低但对你的技术决策没有任何帮助，跳过。

📊 数据概览

推文总数

0

List: 0 + 书签: 0

关键词命中

0

共 52 个关键词

🛠️ 工具精选

0

AI 工具书签

🧠 方法精选

0

AI 方法书签

RSS 条目

0

命中 0 条

活跃作者

0

Top: @-

📋 内容平铺按匹配度+热度排序

推文 (X · AI Builders)

暂无命中内容

暂无内容

RSS（AI 洞察日报 + 其他）

暂无命中内容

暂无内容

暂无命中内容

暂无内容

👤 活跃作者排行

🤖 AIContent 日报

2026-02-25 日报

1. Qwen3.5 系列发布：122B-A10B 和 35B-A3B 同时上线

2. Karpathy：CLI 是 AI agent 的天然主场

3. 🧠 Prompt 重复对 agent 工程任务无效（n=20 盲评）