千问朱达:从「被动响应」走向「主动服务」,C 端 Agent 的多快好省工程哲学

事件内容

6 月 7 日,由中国计算机学会主办、阿里巴巴 ATH-千问事业群支持的 YOCSEF 杭州技术论坛上,千问 C 端 MOS 实验室负责人朱达带来了一场题为《千问 C 端 Agent Harness 思考与实践》的分享。

朱达把自己的团队定位为「务实派」——不追逐模型能力的理论上限,而是要解决「如何用千问模型服务月活过 3 亿用户」这种具体问题。2026 年 1 月正式上线的「通用复杂任务 Agent」(千问 App 对话框上方的「胶囊」入口)是这场分享的主角。他把这款 Agent 的工程方法论,凝练成四个字:多快好省。

具体落地的数字很硬核:执行时间降到初始的 1/3,Token 消耗只有海外同类产品的 1/10 甚至更少。在月活过亿的国民级 APP 上,这是一份不容置疑的工程成绩单。

深度剖析

第一,「多快好省」是把 C 端 Agent 当电商做的工程语言。

朱达的拆解方式很电商化:

– 多:支持信息搜集、研究分析、生活服务、办公协作、代码开发等多种任务类型。一个通用 Agent 同时覆盖所有类型,而不是做 N 个垂直 workflow – 快:执行时间应该对得上交付质量——执行 5 分钟 / 10 分钟 / 半小时,产出要有阶梯性提升。关键手段是任务并行化 + 「链路固化」(首次遇到的任务需要大量反思,积累经验后把执行路径固化为代码) – 好:业界最难的不是「怎么做好」,是「怎么定义好」。搜集中国从秦朝到清朝的所有钱币种类,这类任务没有「完成」标准,普通 Agent 找到十几种就停。需要靠搜索范式优化 + 上下文管理「逼」模型继续 – 省:产品免费,成本控制是生命线。减少模型调用、让模型写代码替代重复推理、链路固化、缓存优化

这套方法论的特殊之处是:它完全围绕「服务月活 3 亿用户」这一具体约束设计,而不是从模型能力出发倒推产品形态。这是一种「产品驱动工程」的逆向思维,和很多「大模型公司从模型出发找应用场景」的路径相反。

第二,「主动服务」是 2026 年下半年 C 端 Agent 最值得关注的范式升级。

朱达拿出了一个真正的私人助理画像:不是「我总去问我的助理」,而是助理了解你的一切,主动给你服务、主动给你推送。

落地架构是四组件:User Memory(用户画像)+ Environment(环境感知)+ Task System(任务管理)+ Assistant(综合触达)。

最大的难点是「情商」——朱达举的例子非常具体:用户之前提到过某种疾病,推荐餐厅时 AI 提醒「这家太辣,你之前……」,听起来合理,但用户会认为 AI 过度利用了隐私。说多了觉得打扰,说少了没存在感,主动服务对模型智能的要求,在「感觉分寸」这个维度直接超过了基模目前能解决的范围。朱达的判断是:这可能需要基模层面就具备,而不是后训练或 PE 能补的。

第三,「Harness Engineering → AIWare Engineering」的演进,从工程史对照里找到了根据。

朱达借助一个「计算机发展史」的隐喻,把 Agent 工程分成了四个阶段:

年份	计算机史事件	Agent 工程阶段
1946	ENIAC 诞生	大模型(原始计算力)
1949	汇编语言	Prompt Engineering
1968	NATO 软件危机会议(「软件工程」这个词被正式提出)	AIWare Engineering
1969	Unix 操作系统	Agent 框架 / Harness
1972	C 语言	Context Engineering

关键洞察是:1968 年是真正的转折点——那时候 CPU、操作系统、C 语言都出来了,大家以为软件问题已经解决了,结果发现真正难的是「软件解决的不是代码问题,而是人的问题——预期、项目管理、团队组织」。把这件事搬到 AI 时代:Harness Engineering 的下一步,是 AIWare Engineering——怎么真正把人和 AI 结合在一起。

第四,「低功耗、够用就行」是这场分享里最反共识的判断。

朱达引用人类进化史:7 万年前人类进化出语言、大脑容量增加;此后文字、造纸术、印刷术、无线电、互联网——人类大脑容量再也没有增加过。后面的进步本质都是在优化「上下文工程」——信息能存、能传、能更快交流、人与人的协作方式更高效。

把这个观察搬到 AI 上,他的核心观点是:模型不是不能做到更精准,但 ROI 划算吗? 对能源和成本的需求合理吗?也许用更低功耗、更好的 Harness 方法,也能大概达到更高模型的效果——而从整个社会发展来说,这更合适。基模 + Harness,最终形成一个合理的状态,而不是无止境地追求单一维度的极致。

值得关注的原因

这是一份罕见的同时具备「宏观视野」和「硬核工程数字」的 C 端 Agent 复盘。如果只挑三个信号,我的判断是:

信号一:1/3 时间 + 1/10 Token——C 端 Agent 的成本曲线已经被中国大厂压到极限。这对未来 12-18 个月的全球 C 端 Agent 商业化竞争是关键参考。

信号二:「主动服务」会成 2026 下半年 C 端 Agent 的主战场。月活过 3 亿的千问 App 把这条线推到产品形态,意味着后来者必须正面回答「你打算怎么主动推送」这个问题。

信号三:「AIWare Engineering」正在成为新热词。从 Prompt 到 Context 到 Harness 到 AIWare,这条工程演化路径会在下一次 YC 演讲、播客、YC 创业营里被反复引用——它是接下来 6 个月内的概念矿。

风险与待观察

第一,朱达的判断「很多之前的脚手架随着基模进步不需要了」是有教训价值的——Harness Engineering 现在的很多工程补丁,会被下一代基模吃掉。这意味着 Harness 工程的护城河,可能比想象的要短。

第二,「情商」这个最难的问题,目前没有看到任何模型/团队给出系统解法。千问目前的「主动服务」大概率还处于「细颗粒度试探」阶段,而非完整的能力突破。未来 3-6 个月看千问 App 的实际表现,会比看分享本身更有信息量。

第三,「低功耗够用就行」是工程哲学,不是商业战略。如果其他大厂(尤其是 OpenAI/Anthropic 阵营)继续以「更高智能、更强基模」作为竞争主线,千问的「低功耗哲学」能不能扛住中美基模代差,需要时间验证。

来源:阿里巴巴 ATH-千问事业群 MOS 实验室负责人朱达在 CCF YOCSEF 杭州技术论坛(2026 年 6 月 7 日)的引导发言

事件内容

深度剖析

值得关注的原因

风险与待观察

发表回复取消回复

实时焦点