原标题:你会看吗?直播间里的数字人:24小时全年无休直播带货!
当不少人还在议论谁的工作岗位会被AI替代时,一大批AI员工早已上线……
01、现象级的AI应用
开启民智的“通义舞王”
任何应用的崛起都离不开现象级产品的推动,曾经,《精灵宝可梦GO》勾起了人们对AR应用的好奇心,《完蛋!我被美女包围了》激活了大众对真人影像互动游戏的热情,而现在,“通义舞王”则让视频生成这种AIGC形式“飞入寻常百姓家”。 在“通义舞王”亮相之前,市场其实有不少针对照片转视频的应用,但无论是2D照片转3D光影场景的LeiaPix Converter,还是字节跳动的开源模型Magic Animate,均具有一定的操作门槛,用户往往需要通过学习才能生成想要的动态视频。
同样能让照片跳舞的字节跳动的开源模型Magic Animate,操作门槛较高而“通义舞王”只需要用户在最新版通义千问APP内输入“通义舞王”“全民舞王”等口令后,即可进入体验页面。根据提示,用户需要经历“选择舞蹈-上传照片-生成视频”三步,进入舞蹈选择界面后,目前提供科目三、DJ慢摇、只想对你说“爱你”、兔子舞等十余种预设好的舞蹈模板,选择感兴趣的舞蹈模板后,点击进入,然后选择“舞同款”,即可根据提示上传照片。
“通义舞王”大大降低了易用性从照片识别、人体3D重建到生成对抗网络(GAN)的不断挖掘与优化,让照片跳舞这一“简单”应用的背后,往往是各家科技企业AI大模型技术的支持与践行,以舞姿为主的动态视频需要解决动作僵硬、连贯自然等问题,AI大模型算法在其中扮演了非常重要的作用,而除了在朋友圈“斗舞”外,通过照片乃至视频的采集,生成真人数字影像的做法,能在动画、影视剧及游戏内容生产中发力,有效降低当前视频内容的生产成本,进而有效推动大模型在AIGC领域的落地和应用。
02、让照片说话,腾讯智影PK万兴播爆
相对让照片跳舞,少了肢体动作的“让照片说话”应用相对成熟,目前腾讯智影、万兴播爆、CrazyTalk、迅捷视频剪辑等软件均加入了“让照片说话”功能,除发朋友圈逗乐外,较快地商业化落地前景也刺激了该细分赛道的成长。通过一张照片生成的数字人,完全可以代替本尊完成述职报告、公司/部门年度总结甚至企业培训等工作,更在儿童早教、电商直播等领域大展身手,极具生产力价值。
由照片生成的虚拟数字人已在电商直播等领域开启“打工”生活而综合考虑平台技术支持以及影音资源库规模,笔者这里特选用“腾讯智影”和“万兴播爆”两款软件进行对比,以便大家进一步了解当下“让照片说话”功能当下的实力。
入口:腾讯智影优势明显。背靠微信生态的腾讯智影可通过小程序直接访问,从界面设计来看,其移动版功能相当完善,而“照片播报”作为重点功能,也占据了首界面UI的中间显眼部分。万兴播爆目前暂未提供小程序入口,不过用户可以在“万兴播爆”微信公众号对话框中点选底部菜单的“立即制作”按钮,从而进入“照片说话”功能界面。
腾讯智影和万兴播爆小程序界面设计对比两者微信小程序UI界面对比发现,腾讯智影在功能上更偏完善,其完全可以当做移动APP使用,基本搭载了腾讯智影的主流功能,而万兴播爆的小程序则偏体验性质,其功能定位相对单一,用户需要安装独立的万兴播爆APP才能获得完成的功能体验。
万兴播爆定位更偏细分赛道而从腾讯智影和万兴播爆的功能定位可以看出,前者除数字人播报和照片播报这类偏向生产力的工具外,还加入了宠物写真、AI简笔画、智能抹除等多样化的功能,很好地兼顾了B端和C端用户的需求。万兴播爆则更偏向B端用户一些,其细分功能并不算多,但主要就是围绕照片、数字人等元素展开,且提供了解说视频、营销推广等热门模板供用户选择,具有更强的针对性。 此外,两款软件均提供PC版,重度用户完全可以在PC上完成数字人的打造。
功能:腾讯智影照片播报更具可玩性,万兴播爆数字人更优。进入腾讯智影照片播报功能后,其分为照片主播和AI绘制主播两个板块,前者目前默认提供8个预设的人像照片播报,用户也可以选择上传照片,使用个人照片作为主播,但更有趣的是AI绘制主播功能,用户可以输入人像关键词后让AI生成独一无二的虚拟主播形象。
除上传照片外,腾讯智影支持AI生成主播形象选择好主播人物形象后就可以进入下一步输入要播报内容的文字并选择想要的主播声音了。腾讯智影目前支持500字的播报内容,而预置数十位不同年龄、特点的声音模板可供选择,声音资源可谓相当丰富。
点头动作加上嘴唇的变化,主播人物颇为灵动万兴播爆的“照片说话”功能就更偏娱乐性,用户提交照片之后同样会提示输入文本内容并选择主播声音,不过其预置的主播声音并未做分类处理,选择起来颇为耗时。
万兴播爆的“照片说话”功能同样具有很好的易用性除“照片说话”外,数字人播报也是腾讯智影和万兴播爆的主推功能,两者均是以数字人为核心打造营销视频,进入两款软件的数字人播报功能后,用户均需提前选择视频比例尺寸,以满足不同平台使用和内容分发的需要。在具体的操作界面,腾讯智影小程序仅提供了数字人和背景两项可选,能够满足用户基本需求,而万兴播报则在选择数字人和模板比例后进入类似“剪映”的工作界面,不仅提供数字人更换和配音选项,更预置了多个模板和背景供用户选择,整个视频制作流程已经同日常真人视频剪辑类似了。
万兴播报在“数字人”播报应用上具有一定针对性
03、编辑点评:数字人正在加速变现
从“照片说话”到“数字人主播”,毫不违和的表情和动作,让人们看到了数字人“分身”的可能性,而可以做到全年二十四小时无休的数字人在电商、主播等领域的应用,也成为其最直接有效的变现模式,而可靠的盈利模式也会反过来推动腾讯智影、万兴爆播等平台不断迭代。当然,体验久了我们也发现数字人主播同真人相比还是有一定差距,如眼神和表情微动作更像是循环播放,背景环境融入感不强等问题也有待提升,只是大方向已定的情况下,虚拟数字人员工必将入职。 返回搜狐,查看更多
责任编辑: