10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作,且能够一键调用多工具解决多场景问题。此外,百度搜索还发布行业首个开放式实时互动的数字人智能体。
同日,视频生成模型百度蒸汽机(文心专精)再次升级。该模型突破传统AI视频生成10秒左右的时长限制,实现AI长视频实时交互生成。
文心助手上线8种模态创作能力
据百度搜索相关负责人介绍,百度搜索文心助手在任务解决、创作生成能力等方面进一步升级。在任务解决方面,升级后的文心助手支持一键调用多工具,解决生活、健康、教育、工作等多场景问题。在内容创作领域,文心助手已经支持AI图片、AI视频、AI音乐、AI播客等8种模态创作能力。截至目前,每天都有千万量级的AIGC内容由用户通过文心助手创作产生。
例如,文心助手的长视频生成玩法,输入一段话,即可创作一部 3 分钟的故事大片。同时,文心助手还集成“一句话写歌”“MV制作”“名场面模仿秀”等创作功能,以及超30种特效玩法模板,后续还将上线音乐数字人分身功能,覆盖从图片处理到视频制作的多元创作需求。
蒸汽机模型实现AI长视频实时交互
百度蒸汽机再次升级,实现AI长视频实时交互生成。该功能升级依托流式视频技术实现“无限时长”生成,突破传统AI视频生成10秒左右的时长限制。
据了解,用户只需上传单张图片与一段提示词即可启动视频生成流程,并能实时预览模型推理全部内容。在生成过程中,用户可随时暂停或在任意节点修改提示词,实现对视频剧情、画面、转场的实时控制,全程干预。这意味着,AI视频从“单向生成”迈向“双向共创”,实现“无限画布”式的连续创作体验。
此外,此次升级同步推出了可交互数字人与开放世界动态构建两大功能。数字人支持沉浸式双向互动,可应用于AI导购、教育、陪伴等场景;开放世界则允许用户通过自行操控,在AI生成的游戏地图、旅游景点、宇宙空间等环境中自由探索。