等推理和非推理的模型聚合到一起,在此之上增加一个“路由器”进行任务分配。
由于经验不足,这个“路由器”做分配时甚至还出现过能力不如4o的时候,从而引发用户大面积吐槽。OpenAI创始人、CEO山姆·奥尔特曼迫于压力答应让ChatGPT-4o回归。
但这并不意味着,人类在通向AGI的道路上戛然止步,相反,Meta、谷歌、微软、腾讯、联想集团等诸多中美企业以及行业、个体,正集体受益于AI大模型带来的结构性增长。
从4月1日-6月30日的季度财报显示,Meta、谷歌、微软都实现了双位数的增长,Meta的净利润同比增长甚至达到了36%。在Meta的业绩报告描述中,AI推荐模型推动Instagram广告转化率提升5%、Facebook提升3%,内容互动与停留时间显著增长。AI创新已成为Meta广告和内容生态的核心增长驱动力。
相似的结果同样发生在中国巨头身上。8月13日,腾讯发布Q2业绩显示,总营收1845亿人民币,同比增长15%,其中营销服务业务收入同比增长20%至人民币358亿元,主要受益于AI驱动的广告平台改进及微信交易生态的提升。
8月14日,联想集团发布同时期业绩报告显示:总营收达1362亿元人民币,同比增长22%;非香港财务报告准则下净利润28.16亿元人民币,同比增长22%,香港财务报告准则下净利润甚至翻番。联想集团认为,两年前布局的“混合式AI”战略,正迈进“价值兑现期”。
除巨头受益之外,IDC预计,到2030年,AI将累计产生19.9万亿美元的全球经济影响,推动2030年当年全球GDP增长3.5%;每1美元AI支出将带动4.6美元的间接和诱发效应(如供应链收入、生产效率提升等)。
大模型本身的“爆发式进步”变得越来越难,但AI的落地应用正在全球开花。未来2-3年,AI竞争主线将从“单点模型性能”转向“系统级架构创新”。有意思的是,Meta、谷歌、微软、腾讯、联想集团这些中美巨头,基本都采用了混合式AI架构,从算力基础设施到大模型平台,均为混合模式,同时通过云、边缘、本地多层协同,构建智能体网络、实现跨平台多场景智能交互操作,完成个体智能和企业智能的超级智能。
行业共识就是,大模型仍会进步,但短期“爆发式”的体感跃迁更可能来自系统与架构创新:把模型放到一个混合式、可治理、可执行的系统架构里,往往更能拉动实际效果和业务指标,完成AI最后一公里的落地。
ChatGPT-5的路由器架构,就类似于混合式AI架构下的大模型平台。如同:联想集团去年推出的大模型路由器技术,即根据不同的算力以及行业特征自动匹配相应规模的大模型。
而且,就在ChatGPT-5亮相的前一周,OpenAI还首次发布了两个开源小参数大模型GPT‑OSS‑20B和GPT‑OSS‑120B。前者可在普通PC(如16GB RAM、骁龙)本地运行,后者在PC搭载了RTX PRO GPU芯片之后也可本地使用。这意味着,OpenAI正在推动AI从云端走向本地端和边缘端,这也是混合式AI架构的一个重要特征。
奥尔特曼在X社交平台上称:“GPT-OSS是件大事(a big deal)”,因为它强调了大模型在真实场景下的推理表现。无论是ChatGPT-5的路由器,还是两个GPT‑OSS开源模型的推出,OpenAI都越来越倾向于加速AI应用的落地和商业化,而不再纠结于AGI的实现。
OpenAI还在与苹果前首席设计官Jony Ive合作,共同开发全新AI硬件设备,以满足真实场景下端、云、边的协同计算。同时,OpenAI自“星际之门”开启之后,便不断在寻求搭建多样化的混合算力数据中心。
OpenAI的“司马昭之心已路人皆知”,它不再只局限于研发大模型底座,而是要构建一个多入口的AI生态。从目前的GenAI技术现状来看,达成AI生态的最优架构就是混合式AI架构,即:混合算力(TPU、GPU、NPU、CPU)+数据和知识库+大模型工厂(多模型路由器)+端云边协同+多智能体平台。基于混合式AI架构,才能同时输出个人智能和企业智能的超级智能。
很显然,在个人智能方面,OpenAI已不满足于Chatbot(大模型对话框)入口,它还想构建一个硬件入口。在企业智能方面,OpenAI发布ChatGPT-5时已表露无遗,医学、编程、创意写作,都是其重点拓展行业。而且从目前OpenAI与各国的合作中可以看到,是包括整个混合式AI架构的建设,奥尔特曼将其统称为:AI基础设施。
或许OpenAI是借鉴了Meta、谷歌、微软、联想集团的成功经验,这些巨头们几乎都拥有一套成熟的混合式AI架构。
谷歌、微软都拥有提供混合算力的云计算服务,Meta和联想集团虽然没有公有云,但它们在混合算力上也各具特色。Meta拥有多个超大规模混合算力中心,联想则一方面是云计算公司的“递铲人”(服务器制造厂家),另一方面也是私有云与公有云的混合云搭建者。在大模型工厂方面,谷歌选择自研自建,微软和联想选择开放伙伴,但都不局限于一个大模型。
在AI入口构建上,Meta和谷歌软硬通吃,谷歌即将发布Pixel系列新品,Meta的智能眼镜今年上半年在全球智能眼镜市场的份额升至73%;微软则在软件上强势,联想在硬件上强势,根据最新财报,联想PC以24.6%的市场份额稳居全球第一,其中AIPC已占联想PC总出货量30%以上;其他硬件如平板电脑一直居于全球前5的位置,手机也在逐渐回归到前排位置。四者的AI入口清晰,都能完成端、边、云的协同计算,灵活且安全可控。
在多智能体平台的打造上,四者也都拥有成熟的工具和平台。谷歌发布了Agent Engine和开源Agent Development Kit(ADK);微软提供的Azure AI Foundry Agent Service和联想的智能体平台,在业内都已成果卓著,联想甚至给自己做了一个超级智能体——乐享。根据最新财报披露,乐享月活提升255%,拉动销售额增长13.6倍。
基于混合式AI架构,Meta、谷歌、微软、联想便可以强势输出个人智能和企业智能。之前Meta在企业智能上几乎没有涉足,但在今年4月发布Llama 4之后,Meta逐步向多行业提供高度专业化垂直版本的模型。针对医疗、金融、法律、制造、游戏等场景,Meta做了继续训练或指令微调,最终打包成Llama-4-Med、Llama-4-Finance、Llama-4-Legal等垂直版本。
科技巨头们逐渐形成了GenAI时代的增长逻辑:通过混合式AI的系统级架构创新,突破大模型“单点进步瓶颈”, 跳出“大模型独角戏”,构建覆盖个人与企业需求的AI生态,最终达成“让AI深度融入行业与生活,成为增长核心驱动力”的企业愿景。
混合式AI架构,正在进入“AI价值兑现期”,不断输出个人智能和企业智能,推动全社会逼近超级智能的愿景。
k8凯发官网
联想集团董事长、CEO杨元庆在接受媒体采访时,这样定义个人智能:“未来,我们相信不仅仅是以设备为中心的智能,应该逐渐转向以人为中心的智能,AI是跟着人的而不是跟着设备的。”“跟着人的AI,我们或许可以叫它人工智能双胞胎,这是我们的叫法,它可以去跨设备、跨生态或者是操作系统的,同时可以去有效地协调端、边、云上面的数据以及计算能力,帮助我们每个人实现更有效的智能。”
显然,要实现个体智能,仅靠一台AI硬件设备远远不够。科技巨头一般都会打造一个“个人超级智能体”,比如联想天禧、Meta AI、微软Copilot等。然后将这一超级智能体,内嵌于不同硬件设备(手机、平台、眼镜等)或软件(Chatbot、办公软件等)中,为用户打造跨平台、跨设备、端云一体、开放互联的无缝融合AI体验。与此同时,安全体系也得到重构,以可信计算和加密通信的端云一体安全架构,保障数据与模型的全链路安全和用户隐私。
联想将其总结为“一体多端”,并表示已拥有多项首创原生技术创新,包括多模态自然交互的AUI、终端推理加速引擎X-Engine、数据安全与隐私保护领域的可信计算(THCP)、混合个人知识库(HPKB)等。
对于企业智能,因每个企业所处行业和市场地位不同,在实际应用中就显得略为复杂。杨元庆概括认为,企业智能应包括混合式AI的基础设施、计算能力、存储能力、网络能力等,再上面是如何来帮助用户准备数据,如何运用模型工厂,再往上就是有智能体的工厂,在这样的基础架构下各个行业、各个企业才能建立AI通用解决方案(如数字办公、制造业供应链管理等),以及针对不同垂直行业的解决方案。
联想将这种能力统称为“混合式 AI 优势集”,可以向需要建立企业智能的企业,一并输出。而微软则将其称之为“Azure AI Foundry”,其他巨头也有别的叫法,但他们内含的技术架构能力与联想几乎一致。
从逻辑上来看,只要拥有混合式 AI 架构,就可以持续输出个体智能和企业智能。事实也确实如此,科技巨头们不仅创造了业绩新高,他们服务的个体和企业客户也纷纷受益。
根据联想集团财报披露的信息,“天禧”个人超级智能体的用户活跃度显著提升,WAU(每周活跃用户比例)平均值达40%。目前,这一智能体具备五大黄金功能,包括AI操控、AI翻译、AI搜索、AI服务、AI笔记。个体用户在工作效率、学习效果上将逐渐获得可量化收益,真正进入“人人可用、人人受益”的阶段。
以联想打造的制造领域智能体为例,依托制造流程全生命周期覆盖、大语言模型+生成式AI技术场景化适配、全球化部署、模块化扩展四大核心能力,联想创造了全球首个覆盖制造全链的“AI指挥官”,并构建了智能计划排产、AI个性化指导、AI视觉防错、设备预测性维护、紫领人才培养等核心智慧场景。
其中,智能排产可以实现秒级排产,通过模拟全球原料库存、设备状态、物流路径的动态关系,订单周期最高可从行业平均38.4天压缩至7天,交付效率提升82%,库存占用降低81%,可释放数十万甚至数亿级现金流。
联想的智能供应链管理经验,也在赋能其他企业。联想帮伊利打造了供应链控制塔系统,整合了80余项供应指标和140余项广促品指标,降低原奶调配单吨运输成本,24小时到厂及时率提升至98%。
不止供应链,联想还正在帮伊利构建混合式AI架构。“AI转型的本质:不是给传统加速度,而是给未来新架构。”这是联想集团高级副总裁、中国方案服务业务群总经理戴炜的观点。现在对于构建企业智能有很多误区,许多企业将AI视为传统流程的“加速器”,而非业务模式的重构器。伊利的实践证明,真正的AI转型需要的是架构思维而非工具思维。伊利目前在链接消费者和人机协同的工作模式上,都有了巨大的突破。
在个性化方面,伊利借助AI应用构建了全生命周期的服务新架构:通过微信小程序,年轻消费者可以参与新产品共创,老年消费者享受免费健康咨询,妈妈们通过AI工具记录宝宝成长的珍贵瞬间。
这不是在原有客服体系上增加功能,而是重新定义了乳制品企业的商业边界。混合式AI架构对于企业智能的意义,正在于此。
除了企业,混合式AI还可以为城市打造超级智能体。联想城市超级智能体“1+N智能体”架构,可以推动智慧城市迈向4.0时代。目前,联想已经与福建武夷山、湖北宜昌、上海虹口及内蒙古呼和浩特市达成战略合作,联想城市超级智能体在文旅体验、能源管理、智慧交通及产业智能化发展等方面持续释放价值。
像联想一样,构建了混合式 AI 架构的巨头们都在强劲输出企业智能。微软号称,80%财富500强企业采用Azure AI Foundry解决方案。从微软云、谷歌云的高速增长,也能看出企业智能对于混合式AI架构的强烈需求。
现阶段,混合式AI从概念验证进入价值兑现期,已毋庸置疑。企业只要将AI应用场景与核心KPI绑定(广告转化率、GMV、续费率、生产周期等),就能在6–12个月内兑现“可量化”的业绩提升;反之,停留在“演示”或“边缘工具”层面的AI,对报表几无波澜。
IDC预测,到2027年70%的中国头部制造商将使用AI提高员工生产力。到2028年,40%的中国头部制造商将采用AI平台整合供应链数据,风险模拟与预测响应效率提升50%。制造业如此,其他行业的整体趋势也不会有太大偏差。
那些提前布局混合式AI架构的巨头们,显然占有十分明显的优势,未来将持续长期释放这一优势,而不仅仅是昙花一现。因为业内的共识是,GenAI 时代,架构创新将超越大模型本身能力。
ChatGPT-5出现的种种问题,证明了一点:大模型的“突破式提升”窗口正在迅速收窄。Scaling Law的收益递减、算力-能耗-成本三重瓶颈、以及Next-Token Prediction范式的能力天花板,已使GPT-5仅获得2%的性能增益却要付出10倍算力。Grok-3用10×GPU,效果增幅同样低于3%。
Next-Token Prediction在长逻辑链、数值推理、幻觉抑制上边际收益趋零,行业共识是“预训练范式见顶”。
既然“通用基准”趋近饱和,那么,新增能力更多来自系统化集成。今天更大的模型确有进步,但很多真实业务的提升,主要来自工具使用、检索、长上下文记忆、工作流编排等“系统层”要素,而不是仅靠参数规模。谷歌、OpenAI、微软近期的产品路线都把“智能体/工具用法”前置。
在这种背景下,AI落地应用更依赖于架构创新,混合式AI架构是一种尝试,当然可能还会有其他架构的创新。但无论哪种架构创新,都应和混合式AI一样凸显以下4点优势:
混合式AI架构将云端强算力与本地边缘设备协同组合,合理分配计算任务。云端处理大规模训练和复杂推理,利用超大规模计算资源,确保模型能力和更新速度。边缘端和本地设备承担低延迟、隐私敏感或实时响应需求的推理任务,减轻云端压力,提升用户体验和数据安全。令AI系统整体更节能、高效,适应多样化的硬件环境和应用场景,降低部署门槛。
混合式架构促进跨平台、跨设备的AI智能体网络建设,推动智能体从单一模型向多智能体系统演进,使AI能够:在不同设备和应用间无缝协作,实现跨任务、跨场景的智能服务;支持多模态、多任务并行,满足复杂动态业务需求;大大扩展了AI的应用边界,提升智能体生态的灵活性和适应性。
在数据安全和隐私合规性日益严格的环境中,混合式AI可以:支持本地数据处理和隐私保护,避免大规模数据传输风险;满足不同行业和地区的合规要求,促进敏感行业(例如医疗、金融)的AI应用;通过多层架构控制风险,提升整体系统的可信度。
相比于仅依赖超大模型单点突破的策略,混合式AI通过分布式和协同计算降低算力投资和运维成本;支持多样化硬件和生态,促进更多企业和个人用户接入和应用AI;使技术更普惠,推动AI从实验室走向生产实践。
混合式AI架构的这四点优势,在某种程度上弥补了单一大模型存在瓶颈问题。根据公开资料,我整理了一下单一大模型与混合式AI架构在成本、时延、可靠性、个性化方面的不同,如下表,仅供参考。
架构创新(尤其是混合式AI)正成为落地应用胜负手,它把“更大的模型”问题转化为“更聪明的系统”问题。商业壁垒不再是“谁能训更大的模型”,而是“谁能在给定功耗/成本下交付最可靠的AI系统”。
当“更大”不再等于“更强”,混合式AI把算力瓶颈转化为系统红利,成为GenAI落地真正的第二增长曲线。(全文结束)