AI Agent进入生态战：腾讯WorkBuddy的底牌与AI Coding的成本账

OpenAI、Anthropic、字节、阿里、百度……几乎所有大厂都在同一时间把 Agent 能力推到了产品级。OpenAI把Codex合并进ChatGPT，引发了“通用入口吞并垂直Agent”的行业大讨论；与此同时，硅谷和国内的AI Coding工具都进入了一轮密集迭代。

然而，随着AI生成代码量的指数级爆发，行业正面临一个普遍的“提效悖论”：员工个人的代码产出速度大幅加快，但企业整体的项目交付周期、需求响应速度（即组织级效能）却并未见同比例提升。此外，海量AI代码的Review瓶颈、AI幻觉带来的生产环境风险，以及底层大模型同质化下的生态竞争，正成为云厂商和企业共同迈入的“深水区”。

近日，在2026腾讯云AI产业应用大会期间，速途网与多家媒体采访了腾讯云副总裁、CodeBuddy & WorkBuddy负责人刘毅与CodeBuddy & WorkBuddy商业化负责人张翔，试图了解腾讯云在内部数万名工程师中打磨出的“AI原生组织”实战经验。

一、个体提效容易，为什么组织提效却很难？

“到2025年底，腾讯大部分团队90%以上的代码都是用AI生成的，程序员甚至能同时指挥4个AI助理并行开发。”当腾讯云副总裁、CodeBuddy & WorkBuddy负责人刘毅抛出这组数据时，还在为AI渗透率发愁的企业应该会感到更加焦虑。

但他却话锋一转，抛出了一个另一个真相：个体效率的提升，并不自动等于组织效率的提升。

在行业中，衡量AI编码效果的常见指标是“代码接受率”或“编码时间缩短比例”。而在组织层面，刘毅盯的是另一个指标——需求吞吐率。

在他看来，需求吞吐率代表一个团队把用户需求快速转化为上线功能的速度。“对于软件企业来说，需求吞吐率代表一个组织的创新速度，能快速响应市场和用户的需求，快速把需求承载的用户价值真正交到用户手里，我们内部把它定义为AI Coding的北极星指标”。

“如果不重新定义北极星指标，企业很容易陷入AI生产力幻觉。”刘毅说。

此前，速途网在对企业AI实践的长期观察中发现，很多企业引入AI工具之后，个体层面的提效非常明显，程序员写得更快、文案产出更多、客服响应更短，然而组织层的关键指标（即人均产值、新功能交付周期、跨部门协作效率等）几乎看不到显著变化。

围绕“需求吞吐率”这个北极星指标，腾讯内部走通了一条从超级个体到超级团队的四步路径：先培养超级个体；再把经验沉淀成技能、专家、AI助理，变成组织资产；接着把这些沉淀融入财务、行政、招聘、法务这些生产流程；最后配套AI治理，把成本、安全、权限、风险管控全部跟上。

当然，腾讯的实践过程并非没有波折。刘毅坦言，AI幻觉曾经把问题带入生产环境，我们也交过学费。2026年行业开始强调“harness”，给AI更多约束，快速校验。另外，人性上员工不一定愿意分享自己的经验，所以企业内部要用激励和晋升通道来引导。

二、AI写代码之后，人类专家“退居二线”，AI开始“审查AI”

AI Coding的副作用，2026年开始集中暴露。“如果组织内的代码以10倍速度增长，顶层专家天天除了评审代码，不用干别的活了。”刘毅描绘的这个场景，正是当下无数技术总监的梦魇，人类肉眼的Review速度，已经远远跟不上AI“吐”代码的速度。

面对行业级的“代码爆炸”危机，刘毅在采访中称腾讯做了三件事。

首先是人类专家守架构。在他看来，AI可以大量生产代码，但不能随便改架构。架构一改动就会触发告警，由最有经验的专家判断新代码是否需要重构。

另外，腾讯还引入AI review AI，但评审的AI和生产代码的AI不是同一个，这是为了让AI在另一个角度、决策和约束下去发现代码的隐患。

最后是质量左移，用AI大量生产自动化测试代码。以前想用测试代码覆盖整个项目，100%UAT 是个巨大成本，AI时代这个成本不再是问题，可以在UAT阶段直接拦截AI生产的风险。

刘毅还分享了一个内部实践，团队从第一天起就做成AI原生组织，极度扁平，同时，他还要求所有团队的上下文都是透明的、共享的，即所有代码、需求、反馈、设计都在一个共享的“大餐”里。在这种模式下，AI的开发范式转变为人类给AI提需求，AI在非常透明且充分的上下文工作，不会因为信息隔阂而低效，它根据人类意图拆解任务，找到上下文，生成制品，然后结果又回流到大餐里。

可见，“用AI监督AI”已经从一句口号，变成了2026年AI Coding的基础设施。