百度沈抖:AI应用在B端率先爆发,亟需新型AI基础设施

<{$news["createtime"]|date_format:"%Y-%m-%d %H:%M"}>  IPO早知道 4010阅读 2024-11-12 21:24


大模型进入深度应用期。
本文为IPO早知道原创

作者|Stone Jin

据IPO早知道消息,以“应用来了"为主题的百度世界2024于11月12日在上海召开。

目前,百度智能云拥有中国最大的大模型产业落地规模。超过六成的央企和大量的民营企业,正在联合百度智能云进行AI创新。百度智能云千帆大模型平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用、文心大模型日均调用量超过15亿次。

百度集团执行副总裁、百度智能云事业群总裁沈抖表示,AI应用正率先在B端爆发。由企业级大模型工程平台、异构算力平台组成的新型AI基础设施,将替代传统云计算,为大模型应用在企业生产力场景中的规模落地提供关键支撑。

在沈抖看来,“企业级”AI应用大量涌现的背后,是产品服务形态的突破性变革与能力的大幅拉升——以百度智能云“曦灵”数字人平台为例,全新升级的“文生3D数字人视频”功能,能够大幅提升电商、教育、文旅等行业的内容创作、营销推广效率,大幅降低成本支出。

沈抖指出,无数的AI应用,正在重新定义人与数字世界、物理世界之间的交互方式。现在,这些应用已经深入到企业“研产供销服”的各个环节,并成为企业提升竞争力的关键要素。

当然,大算力是大模型落地的基础条件。为了满足企业落地大模型从集群创建、开发实验,到模型训练、模型推理的全旅程算力需求,百度智能云推出百舸AI异构计算平台 4.0,服务了中国石化、中海石油、长安汽车、上海交通大学、地平线等行业龙头企业和机构,目前已具备了成熟的10万卡集群部署和管理能力。

沈抖表示,为了支撑大模型的进一步高速发展,百度智能云提前布局,是行业内最早打磨10万卡集群能力的厂商之一,并通过技术创新解决了集群算力供给、跨地域部署两大核心难题。

首先,在算力供给方面,百舸平台兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持同一智算集群中混合使用同一厂商不同代际芯片、不同厂商芯片,最大程度上屏蔽硬件之间差异,帮助中国企业摆脱单一芯片带来的高溢价和供应链风险。

目前,在万卡规模集群上,百舸能够将两种芯片混合训练大模型的效率折损控制在5%以内,达到业界最领先的水平。未来,“一云多芯”将成为中国企业的必然选择。

另一方面,10万卡规模超大集群需要占据大概10万平方米空间,相当于13个标准足球场;每天则要消耗大约300万千瓦时的电力,相当于北京市东城区一天的居民用电量。这种对于空间和能源的巨大需求,远超传统机房部署的承载能力,而跨地域机房部署又会给网络通信带来巨大挑战。

通过设计高效的网络拓扑结构,结合模型切分优化和跨地域无拥塞高性能网络方案,百舸能够在横跨几十公里的多机房组成的万卡规模的集群上,将单一模型训练任务的性能折损控制在4%以内,达到业界最领先水平。

本文来源:IPO早知道

来源:IPO早知道

重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服

网友评论