小冰COO徐元春“揭秘”超写实虚拟人制作成本:运营一年可能花费五六百万
2022年2月23日,网易科技频道年度策划“2022,请回答”大咖线上对话栏目第四期《2022,如何玩转“虚拟人”?》直播现场,小冰公司首席运营官、人工智能创造力实验室负责人徐元春、咪咕体育数智达人(MSC)工作室负责人王珊珊、知春资本创始合伙人王禹媚相继出席。小冰公司首席运营官、人工智能创造力实验室负责人徐元春表示,导致虚拟人市场快速变热的首要原因,并不是因为大家在讲的是元宇宙让虚拟人变热了,更为重要的是产业相关技术的快速发展。“在大家看来突然爆火的赛道,实际上我们过去七年一直朝着这个方向在走,对我们来讲,是这些年一代代技术迭代走到了今天,并不是突然间从零到一的变化,而是一个持续量变的过程。”
对于大众好奇的“如何生产一个虚拟人”等问题,徐元春详解了目前打造一个虚拟人需要哪些技术,及现阶段技术攻克难点等问题。并以小冰旗下产品为例,拆解了制作虚拟人大致需要的步骤以及制作成本。他表示,目前运用3D建模等类似技术制作的超写实虚拟人,仅单个形象部分,3D模型成本就在30-45万左右,运营一年可能要花掉五六百万。
http://cms-bucket.ws.126.net/2022/0302/bff945fej00r83svf0345c003c003w0c.jpg
以下为网易科技《2022请回答》第四期《2022,如何玩转“虚拟人”?》直播连麦小冰公司首席运营官、人工智能创造力实验室负责人徐元春对话部分内容:
主持人:我们都知道小冰旗下有夏语冰、N小黑等,请先介绍下小冰目前旗下有哪些虚拟人矩阵?
徐元春:小冰目前主要拥有几种不同类型的虚拟人。第一种是,数字员工类型,比如我们为万科开发的“崔筱盼”;第二种类型在我们看来是专家型的虚拟人,比如说我们为国家体育总局开发的辅助训练的裁判系统“观君”,也包括我们每日经济新闻制作的“N小黑”;第三种是偏娱乐、偏明星类型,包括刚在抖音上线的我们和中央美术学院合作的数字虚拟艺术家“夏语冰”,她刚刚发布了单曲,她的作品也参加了迪拜的世博会。
主持人:2021年国内虚拟人能够“大热“的原因是什么?
徐元春:在我看来,导致了市场快速的变热的首要原因,并不是因为大家在讲的是元宇宙让虚拟人变热了,最重要的一个原因是相关技术的快速发展。整个的3D建模包括4G的技术,很早之前就有,好莱坞各种各样的特效电影都已采用过,但即便今天做一个超写实的虚拟人,可能成本还比较高,但是相比之前成本得到了很大的控制和降低,所以这也是我们能看到很多国内公司开始大力发展超写实或者3D建模的虚拟人。
拿我们自己举例,小冰这些年一直在做各种各样技术的积累,从最开始文本交互的技术,小冰从做聊天机器人开始就在各种硬件汽车交互里积累了经验,累积了包括超自然语音技术,人工智能创造力的技术,直到现在我们把最后一块模块拼齐,就是用神经网络渲染技术完成了不用3D建模的逻辑就能形成高清自然形象的创建。在大家看来突然爆火的赛道,实际上我们过去七年一直朝着这个方向在走,对我们来讲,是这些年一代代技术迭代走到了今天,并不是突然间从零到一的变化,而是一个持续量变的过程。
主持人:大家都很好奇如何制作一个虚拟人。请以小冰旗下某个虚拟人为例,讲一下制作虚拟人大致要分为哪些步骤?
徐元春:我们最近刚刚发布了和蓝色光标合作上线“分身有术”数字人驱动平台,并制作了蓝色光标董事长赵文权的数字虚拟人。如果大家看到这条视频的话,可以发现我们还没去做交互,只做了形象和声音。在这个案例中,我们先需要赵董事长在摄影棚拍摄一个多小时左右,采集了大概三十分钟有效数据作为视频的训练素材,这个就足够让我们的模型在一周左右的时间完成整个训练。接下来,输入文本信息之后,这个视频就会自动生成,赵董事长就栩栩如生的在你面前去表达自己的观念,这是最简单的一个过程。
在此基础上,如果你要复刻这个人的声音,那么就再加上一个声音训练的模型。如果想要他具备某种能力,比如具备财务知识,那么我们会为他配备适合的知识图谱,一个一个能力模块不断集成去完成。
主持人:打造一个成型的虚拟人,大概会耗费多长的时间和人力,制作成本大致在什么规模?
徐元春:单从形象的角度来讲,今天大家如果使用3D建模或者这种类似技术的话,从市面上能够看到,做一个3D模型大概是几十万,30-45万左右不等,这是市面上平均价格。然后你再去做动作,做绑定,去做这种海报,一张大概市面上报价基本上是1-2万。如果你想要做到周更的话,一年也要100多万。如果你要再想去做视频的话,大概平均下来15秒的视频也需要100万左右。如果你要用3D建模的技术去运营这样一个虚拟人的话,在不追求特别高质量,只求平均水平的话,这一年可能要花掉五六百万,而这只是形象部分。小冰自己现在在用神经网络渲染技术制作虚拟人,因为是时时生成驱动的,这样的一个虚拟人可能一年的话,大概要几十万左右的成本。
另外,在语音技术上,现在有很多厂商也能提供定制,这是一个比较成熟的市场,无论是科大讯飞、百度包括我们,基本都在一个市场的公允价格范围内,可以根据你的要求去选择不同的声音定制能力。
其实,这里面最难去衡量的是虚拟人的专业能力。一个虚拟人的专业能力是指你希望他干什么。举个例子,如果你希望虚拟人能够快速的完成财经新闻的摘要,那么你要去训练他去做文本摘要,甚至财经文本摘要,这其实都是很专业的问题。所以我们和很多合作伙伴在讨论这件事情的时候,都会先跟大家介绍最后一个部分,就是需要事先去规划和想清楚自己的这个虚拟人到底想拥有的能力是什么,他的边界是什么。因为,这直接取决了大家对这件事的投入成本的可预期范围,当然更主要的还要看到这个虚拟人给你带来的收益在哪里,不能为了做一个虚拟人而做一个虚拟人,你要找到自己合适的能力,价值上的应用。
主持人:在虚拟人的运营方面,如何赋予虚拟人不一样的“灵魂”? 什么样虚拟人才能“红”?
徐元春:有两个维度。如果说,今天如果你运营的虚拟人是个偏歌手和娱乐型的,那么你的目标是他要红,要有流量的。另外一种,如果你做的虚拟人本身就是为服务一个具体的领域而生,那么红就不是他最主要的衡量指标。
我们先说后一种,不管是我们给万科做的虚拟员工崔筱盼,或者是我们给冬奥会做“观君”,这些虚拟人最重要的价值在于,他在产生了人类替代不了的价值,产生了更大的收益。其实很多人曾经问我说,万科做这个数字员工是不是因为省工资,其实不是他最大的价值是创造了一个过去员工实现不了的价值。
另外一种类型就是我们看到的偏娱乐类型的,小冰也有像夏语冰这样的虚拟人,我们怎么去运营?其实,现在虚拟人赛道里有一种类型公司叫作虚拟人运营公司,比如AYAYI的运营方其实也做得就很好。我们这两年也在和这样的合作伙伴合作,我们最近也在和很多娱乐影视公司在探讨更深度的合作。但目前位置,市面上更多情况是大家都在探索和摸索,没有一个人有非常成功的经验可以去跟拿出来分享。
页:
[1]