2025年,AI模型、AI算力、AI应用彼此推动,呈螺旋上升之势。传统云架构也正在被打破,朝AI云原生的方向演进。
国际市场调研机构IDC数据显示,2024下半年,中国公有云市场增速17.7%。
2024年5月,火山引擎将大模型推理成本降低了90%以上,这一策略不仅降低了客户使用AI的成本,还迫使其他云厂商跟进降价。成本的下降带来了市场的扩容。据IDC数据,2024年12月中国公有云大模型日均token调用量高达9522亿,这一数字是2024年6月日均调用量963亿的近10倍。
6月11日至12日,2025火山引擎原动力大会在京举办。新华社记者张漫子摄
而2024年大模型调用总量中,火山引擎市场份额达46.4%。截至2025年5月,豆包大模型日均tokens调用量16.4万亿,相比2024年5月的1200亿增长137倍。
“把时间拉长,我们正处于PC时代到移动时代再到AI时代的变化之中。技术主体也在发生变化:从网页、App,变为AI智能体。”日前在京举办的2025火山引擎原动力大会上,火山引擎总裁谭待说。
应用范式的变化,正带来云计算基础架构的创新。过去几年,传统云计算的产品创新几乎是停滞的,谈到云计算,人们常提起的是IaaS、PaaS(平台即服务)、SaaS(软件即服务)。而在AI时代,AI模型快速迭代、AI应用加速爆发、AI算力指数级增长,这个分层结构正被消解。
谭待说,IaaS、PaaS、SaaS的架构更关注技术分工,而AI云原生更多是按照业务架构重新划分IT架构。具体而言,是以Agent为核心重新优化计算、存储与网络架构。目标是让算力基础设施能在单位时间内更快、更多地产生token,以使AI应用的响应速度越来越快。
“复杂的Agent、完成好复杂任务,不仅需要模型优化,背后的服务也得优化,还要准备好调优的环境等。把基建做好、把池塘做大,这是最重要的事情。”谭待说。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
广东省委网信办相关领导、广东省游戏行业协会常务理事陆,广东省律师协会未成年人保护...
感谢IT家庭用户钻石之窗和夕阳商城的线索传递!OPPO官方宣布将为EncoX2和...
今年戴尔的明星产品XPS13Plus在中国上市时,戴尔曾发文介绍这款笔记本的工业...
今年618,消费者可以在天猫国际海淘的同时“种草”。5月31日,天猫国际推出淘宝...
哈华通今日跌9.20%,全天换手率54.26%,成交4.76亿元,振幅11.59...