OpenAI、Anthropic、字节、阿里、百度……几乎所有大厂都在同一时间把 Agent 能力推到了产品级。OpenAI把Codex合并进ChatGPT,引发了“通用入口吞并垂直Agent”的行业大讨论;与此同时,硅谷和国内的AI Coding工具都进入了一轮密集迭代。
然而,随着AI生成代码量的指数级爆发,行业正面临一个普遍的“提效悖论”:员工个人的代码产出速度大幅加快,但企业整体的项目交付周期、需求响应速度(即组织级效能)却并未见同比例提升。此外,海量AI代码的Review瓶颈、AI幻觉带来的生产环境风险,以及底层大模型同质化下的生态竞争,正成为云厂商和企业共同迈入的“深水区”。
近日,在2026腾讯云AI产业应用大会期间,速途网与多家媒体采访了腾讯云副总裁、CodeBuddy & WorkBuddy负责人刘毅与CodeBuddy & WorkBuddy商业化负责人张翔,试图了解腾讯云在内部数万名工程师中打磨出的“AI原生组织”实战经验。
一、个体提效容易,为什么组织提效却很难?
“到2025年底,腾讯大部分团队90%以上的代码都是用AI生成的,程序员甚至能同时指挥4个AI助理并行开发。”当腾讯云副总裁、CodeBuddy & WorkBuddy负责人刘毅抛出这组数据时,还在为AI渗透率发愁的企业应该会感到更加焦虑。
但他却话锋一转,抛出了一个另一个真相:个体效率的提升,并不自动等于组织效率的提升。
在行业中,衡量AI编码效果的常见指标是“代码接受率”或“编码时间缩短比例”。 而在组织层面,刘毅盯的是另一个指标——需求吞吐率。
在他看来,需求吞吐率代表一个团队把用户需求快速转化为上线功能的速度。“对于软件企业来说,需求吞吐率代表一个组织的创新速度,能快速响应市场和用户的需求,快速把需求承载的用户价值真正交到用户手里,我们内部把它定义为AI Coding的北极星指标”。
“如果不重新定义北极星指标,企业很容易陷入AI生产力幻觉。”刘毅说。
此前,速途网在对企业AI实践的长期观察中发现,很多企业引入AI工具之后,个体层面的提效非常明显,程序员写得更快、文案产出更多、客服响应更短,然而组织层的关键指标(即人均产值、新功能交付周期、跨部门协作效率等)几乎看不到显著变化。
围绕“需求吞吐率”这个北极星指标,腾讯内部走通了一条从超级个体到超级团队的四步路径:先培养超级个体;再把经验沉淀成技能、专家、AI助理,变成组织资产;接着把这些沉淀融入财务、行政、招聘、法务这些生产流程;最后配套AI治理,把成本、安全、权限、风险管控全部跟上。
当然,腾讯的实践过程并非没有波折。刘毅坦言,AI幻觉曾经把问题带入生产环境,我们也交过学费。2026年行业开始强调“harness”,给AI更多约束,快速校验。另外,人性上员工不一定愿意分享自己的经验,所以企业内部要用激励和晋升通道来引导。
二、AI写代码之后,人类专家“退居二线”,AI开始“审查AI”
AI Coding的副作用,2026年开始集中暴露。“如果组织内的代码以10倍速度增长,顶层专家天天除了评审代码,不用干别的活了。”刘毅描绘的这个场景,正是当下无数技术总监的梦魇,人类肉眼的Review速度,已经远远跟不上AI“吐”代码的速度。
面对行业级的“代码爆炸”危机,刘毅在采访中称腾讯做了三件事。
首先是人类专家守架构。在他看来,AI可以大量生产代码,但不能随便改架构。架构一改动就会触发告警,由最有经验的专家判断新代码是否需要重构。
另外,腾讯还引入AI review AI,但评审的AI和生产代码的AI不是同一个,这是为了让AI在另一个角度、决策和约束下去发现代码的隐患。
最后是质量左移,用AI大量生产自动化测试代码。以前想用测试代码覆盖整个项目,100%UAT 是个巨大成本,AI时代这个成本不再是问题,可以在UAT阶段直接拦截AI生产的风险。
刘毅还分享了一个内部实践,团队从第一天起就做成AI原生组织,极度扁平,同时,他还要求所有团队的上下文都是透明的、共享的,即所有代码、需求、反馈、设计都在一个共享的“大餐”里。在这种模式下,AI的开发范式转变为人类给AI提需求,AI在非常透明且充分的上下文工作,不会因为信息隔阂而低效,它根据人类意图拆解任务,找到上下文,生成制品,然后结果又回流到大餐里。
可见,“用AI监督AI”已经从一句口号,变成了2026年AI Coding的基础设施。
三、生态,是AI Agent的下半场
据腾讯2026年Q1财报披露:以日活跃账户数计,WorkBuddy已成为中国最受欢迎的效率AI智能体服务。在2026腾讯云AI产业应用大会上,WorkBuddy企业版及办公智能体套件Agent Suite正式发布。
那么,衡量企业AI落地健康程度的核心指标到底是什么?刘毅在采访中表示是需求吞吐率与AI留存的平滑度。至于WorkBuddy为什么能跑出行业第一,底牌在于其底层嵌入了腾讯打磨两年多的Coding Agent OS内核,这个强大的内核让WorkBuddy处理各种场景游刃有余。
不过,刘毅在采访中也直言,字节、阿里都已经推出类似产品,前面基于Coding Agent积累的优势也不会持续,最后决胜负的是生态。在速途网看来,这与行业对AI Agent的判断一致,上半场的关键词是“模型”,下半场的关键词正在变成“生态平台”,而这个转变,正在以肉眼可见的速度发生。
在生态之外,模型调用的成本也是行业热议的话题。随着DeepSeek等模型将百万token定价拉低至“永久二五折”,企业开始用“每任务成本”而非“每百万token”来评估ROI。
CodeBuddy&WorkBuddy商业化负责人张翔认为,不同的模型价格不同,不同的任务复杂度也不同,重构一个大型工程和修改一个小模块,token消耗天差地别。我们在WorkBuddy平台内建立了统一的货币体系,打通各个智能体(包括腾讯文档等套件),用户提交任务前可以预估算成本。
四、写在最后
“2026 年下半年,企业级AI Agent通用生产力产品会出现快速增长、快速爆发、快速落地的阶段”,刘毅这样判断企业级 AI Agent接下来的发展,在他看来,用户用习惯一个AI入口之后,离开工作岗位也会接着用。
速途网也判断,AI Agent从“个体提效”到“组织提效”的拐点正在到来,谁能先跨过去,用工程化的手段守住质量红线,谁就是下一个十年的基础设施。
本文来自投稿,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/model/161825.html
微信扫一扫
支付宝扫一扫