第27届软博会召开 百度吴甜:AI基础技术平台驱动软件新生态-新华网
新华网 > > 正文
2025 10/15 15:41:14
来源:新华网

第27届软博会召开 百度吴甜:AI基础技术平台驱动软件新生态

字体:

  10月15日,由中国电子信息行业联合会主办的第27届中国国际软件博览会在郑州举办。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜分享了大模型时代AI基础平台驱动软件生态带来的新变化。她表示,大模型的爆发将人工智能推向一个新的高潮。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜

  在开幕式暨主题峰会环节,吴甜表示,大模型具有效果好、泛化性强、研发流程标准化等特点,正引领人工智能的发展。在这一阶段,AI研发范式带来了开发、计算、部署的新挑战,尤其是大模型的高效训练和推理部署,需要软硬件协同发力。

  她进一步讲到,大模型高效训练的关键要素包括训练吞吐、训练有效时间和收敛效率,这背后涉及框架、芯片、集群、算法等软硬件不同组合的协同优化。对大模型的推理部署来说,效果无损、低时延高吞吐、成本效益等要素极为关键,需要模型压缩与量化、并行推理、软硬件协同优化等技术的支持。

  要解决大模型研发所带来的一系列挑战,深度学习平台关键需要具备大规模并行计算、高性能推理部署、全流程工程化三方面能力。以百度飞桨为例,作为百度自研的产业级深度学习开源开放平台,飞桨从核心框架、基础模型库,到端到端开发套件、工具与组件,以及星河社区等,全方位支持了文心大模型的演进过程。飞桨在核心框架和芯片之间构建了硬件适配层,打造多硬件统一适配方案,已适配60多款系列芯片,相比PyTorch,芯片基础适配的接口数减少56%,代码量减少80%。

  在深度学习平台与大模型联合优化下,文心大模型的能力得到了拓展、效率得到了提升,ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%, ERNIE-4.5-300B-A47B模型在TPOT 50ms时延条件下,实现了输入57K tokens/秒、输出29K tokens/秒的高吞吐性能。文心思考模型X1.1相比上个版本,事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。

  大模型与深度学习平台为科技创新和产业升级构筑了坚实的AI基础技术底座平台,但最终在各行各业广泛应用起来,应用生态建设至关重要。

  百度进行了模型及相应配套工具的开源。文心大模型4.5系列已开源11款模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型,配套开源了文心大模型开发套件ERNIEKit、大模型高效部署套件FastDeploy,方便开发者在此基础上实现高效的模型开发和部署,进而在更广泛的行业加速AI的落地应用。

  星河社区为开发者提供全方位服务,已上线700万个实践项目,600多门公开课以及400多场AI竞赛。开发者也在应用中反过来推动AI基础技术平台的完善。目前,飞桨框架贡献者俱乐部成员达到195位,飞桨开发者技术专家411位,全球各地开发者自主建立运营的飞桨领航团超过400个。

  在文心大模型和飞桨深度学习平台的基础上,百度在上海、广州、武汉、南京、宁波、厦门、南昌、无锡等多地落地产业赋能中心、数据生态中心和教育创新中心,加快区域产业智能化升级。例如,在制造行业,中车集团依托百度飞桨产业级深度学习平台以及飞桨科学计算 PaddleCFD 套件,创新性地构建了空气动力学智能化仿真大模型,整体仿真效率提升30倍以上。在能源行业,国家电网联合百度打造的人工智能基础设施,让安全巡检效率提升了36倍。在通信行业,中国联通推出的智能中心AI平台,助力1.3万座基站安全作业。

  公开资料显示,截至2025年9月,飞桨文心生态开发者已达到2333万,服务企业达到76万家。

  

【纠错】 【责任编辑:冉晓宁】