虚拟人盛宴亟待釜底加薪
人工智能技术头角峥嵘
|
◎记者 罗茂林 ○编辑 邵好
北京冬奥会上,虚拟人热度有点高。开赛前夕,央视首位AI手语主播正式亮相,为听障人士提供专业赛事解说。近日,有观众发现会场的实时气象主播,也是一位AI虚拟主持人。
“虚拟人的应用场景很广阔,未来其口碑和商业化双重认证,都会给传统的商业模式带来变革。”风语筑副总经理张树玉表示,“乐观预期,未来一年里,每个人都可能在虚拟世界拥有自己的数字身份。”
近日,上海证券报记者走访多家虚拟人相关企业了解到,虚拟人频繁上镜的背后,是人工智能产业多年发展的水到渠成。当数字经济浪潮来袭,不断拓展商用边界的人工智能技术已然崭露头角。
硬核技术“画皮画骨”
在技术层面,虚拟人并不是新鲜事物。1982年,动画作品《超时空要塞》中的女主角林明美,凭借动人的歌声与纯真的人设走红,成为全球首个虚拟歌手。如今,随着人工智能技术不断迭代,虚拟人正从平面动画走向广阔天地。
“解构虚拟人的概念可以发现,它的核心在于身份和资产。”民生证券元宇宙首席分析师马天诣表示,虚拟人的各种应用场景,本质上是围绕这两个核心概念展开,“具体可以分为三种,第一种是真人的分身,比如明星的虚拟形象;第二种是大众重构的虚拟身份,比如大家各种游戏里的角色;第三种是作为一种商业资产的虚拟偶像。”
万变不离其宗,人工智能技术毫无疑问是支撑起虚拟人发展的关键,背后是新一轮数字经济浪潮滚滚而来。
“虚拟人至少要具备一个独一无二的形象,还有一定的交互功能,后者就涉及自然语言学习等方面。”一位业内人士透露,尽管经历了近40年的迭代,虚拟人的制作成本不断下降,但是单个制作成本依然在百万元级别。
这么高的造价,虚拟人究竟贵在哪里?
风语筑虚拟人项目负责人陈云翔解释称,人物需要大量的毛发建模,这背后是算力渲染支持。正常成年人一般有10万根左右的头发,许多虚拟人为了达到更高的建模要求,头发数量会达到20万至30万根。
“我们之前一段动画CG中,一个核心角色及其服装的建模面数就达到400万,精细到服饰上的水晶珠宝,这些不同立面还会与光影环境交互,运算量也随之大幅增加。”叠纸科技相关负责人透露,公司一段2分钟的CG动画《双城奇遇记》,最终耗时4个月才完成。
此外,动作捕捉也是技术难点,一位业内人士表示,由于人眼可以在毫秒级别的动作中,判断出对象是否为真人,因此虚拟人的动作要足够自然流畅,才能“骗”过人眼。这些都需要强劲的硬件设备、优异的人工智能算法。
为了应对未来更大规模的虚拟人创造,让人工智能“更聪明”也是行业需要解决的核心问题。
一个典型的例子便是虚拟人“捏脸”。“好看是一个很主观的事情,很难直接告诉人工智能如何去做。”谈到自动生成外貌,网易瑶台工程师晚丰表示,目前人工智能训练中主要手段仍是特征量化,在大量训练之后,美术的意见依然至关重要。“比如,我们将面部的一处细节调整幅度设定为1至11,人工智能就会随机在区间调整,但它是不会考虑整体气质的问题,因为气质无法量化。”
“替代真人”恐难实现
今年初,万科首位虚拟人员工“崔筱盼”获评2021年万科年度最佳新人奖的消息,一度引发热议,也让部分网友担心,未来虚拟人是否取代人类的工作。
清华大学新闻学院教授沈阳认为,这种担忧有些多余。虚拟人要完全替代人,有赖于人工智能技术的进步,短期内还不可能实现,至少还要几十年。
画衣画皮难画骨,即使在“人工智能”火爆的今日,虚拟人还远远无法比肩自然人,具体来看可以归纳为两点:谈吐与气质。
作为人工智能领域的核心技术,自然语言学习一直是各大技术巨头力求攻克的难点。经过近10年发展,在机器学习已取得长足进步的今日,自然语言学习已初现曙光。显卡龙头英伟达的CEO黄仁勋在此前的一次演讲中,推出了一个无所不知的“Q版黄仁勋”――Toy-Me。演示中,Toy-Me可实现和人的自然语言交流。
“自然人之间的交流,话语间隔的推理时间基本在半秒以内,这要求计算机在半秒内理解自然语义,然后生成最为合适的回答。”前述业内人士表示,这要求虚拟人有巨大的语料库。英伟达披露,Toy-Me使用的预训练自然语言处理模型Megatron 530B,目前为业内规模最大,通过达万亿参数级别的语言模型训练,在11天时间里,让AI实现GPT-3(第三代生成式预训练)的水平。
该业内人士表示,这种技术距离商业化依然遥远,“这个级别的训练成本接近500万美元,其依托的语料数据接近300TB。”目前,国内大部分虚拟人还不具备实时语言交互功能,相关技术还有很长的路要走。各类虚拟人更接近于影视工业化的创作小样,依托的还是已有的影视技术。
如果说“谈吐”还能通过大数据深度学习模拟,“气质”则完全无法用现有技术复刻,这也是许多游戏行业人士的共识。
“‘暖暖’作为系列游戏的主角,对我们而言,更多时候是一个活生生的人,有着自己的思想和生活态度。”叠纸科技相关负责人表示,从游戏开发的角度看,这些角色的内在气质需要文案师精心把控。在他看来,交互的背后是人物对于所处环境、所遇事件产生的想法和观点,这些既跟角色设定有关,又必须考虑随时出现的变量。考虑到这些因素,尽管“暖暖”已经拥有了不亚于任何虚拟人的3D形象,甚至还有自己的CG短片、MV歌曲,但叠纸科技AI技术的产出应用短期内还处于探索阶段。