百度宣布新升级：实现AI长视频实时交互上线8种模态创作能力 -新华网

10月15日，百度搜索宣布全面升级文心助手AIGC创作能力，支持AI图片、AI视频、AI音乐、AI播客等8种模态创作，且能够一键调用多工具解决多场景问题。此外，百度搜索还发布行业首个开放式实时互动的数字人智能体。

同日，视频生成模型百度蒸汽机（文心专精）再次升级。该模型突破传统AI视频生成10秒左右的时长限制，实现AI长视频实时交互生成。

文心助手上线8种模态创作能力

据百度搜索相关负责人介绍，百度搜索文心助手在任务解决、创作生成能力等方面进一步升级。在任务解决方面，升级后的文心助手支持一键调用多工具，解决生活、健康、教育、工作等多场景问题。在内容创作领域，文心助手已经支持AI图片、AI视频、AI音乐、AI播客等8种模态创作能力。截至目前，每天都有千万量级的AIGC内容由用户通过文心助手创作产生。

例如，文心助手的长视频生成玩法，输入一段话，即可创作一部 3 分钟的故事大片。同时，文心助手还集成“一句话写歌”“MV制作”“名场面模仿秀”等创作功能，以及超30种特效玩法模板，后续还将上线音乐数字人分身功能，覆盖从图片处理到视频制作的多元创作需求。

蒸汽机模型实现AI长视频实时交互

百度蒸汽机再次升级，实现AI长视频实时交互生成。该功能升级依托流式视频技术实现“无限时长”生成，突破传统AI视频生成10秒左右的时长限制。

据了解，用户只需上传单张图片与一段提示词即可启动视频生成流程，并能实时预览模型推理全部内容。在生成过程中，用户可随时暂停或在任意节点修改提示词，实现对视频剧情、画面、转场的实时控制，全程干预。这意味着，AI视频从“单向生成”迈向“双向共创”，实现“无限画布”式的连续创作体验。

此外，此次升级同步推出了可交互数字人与开放世界动态构建两大功能。数字人支持沉浸式双向互动，可应用于AI导购、教育、陪伴等场景；开放世界则允许用户通过自行操控，在AI生成的游戏地图、旅游景点、宇宙空间等环境中自由探索。

【纠错】【责任编辑:冉晓宁】

深度观察

新华全媒头条丨每一位妇女都是时代的书写人、追梦的奋斗者

百度宣布新升级：实现AI长视频实时交互 上线8种模态创作能力

百度宣布新升级：实现AI长视频实时交互 上线8种模态创作能力

百度宣布新升级：实现AI长视频实时交互上线8种模态创作能力

百度宣布新升级：实现AI长视频实时交互上线8种模态创作能力