01引言
数字人技术即将普及化的时代正在迅速来临!
从前年开始,很多品牌主纷纷启用虚拟人作为品牌代言人。请明星不但要承担过高的预算,还有随时可能“塌房”的风险,真人各种不可控的因素让品牌们苦不堪言,于是他们只好转投可以由自己百分百掌控的“数字人”。
而虚拟人爆火的同时,数字人的另一种形态——数字分身也在蔚然成风。这两者的区别简单来说就是“虚拟人”是完全虚构的,直接由计算机生成的,而“数字分身”则是一个真实人物的数字孪生体。
生成式AI技术作为一种利用深度学习模型从数据中学习并生成新的内容的技术,可以根据文本、图像、音频等输入,生成各种类型的输出,如3D模型、视频、动画、音乐、诗歌等。生成式AI技术的进步将为数字人提供了强大的支撑,使其能够适应不同的场景和需求,展现出无限的可能性。这也意味着人们在线交流的形式将彻底发生改变。数字人栩栩如生的外观,生动的表情,再加上AI技术加持下具备“最强大脑”,会为我们营造出逼真的互动性。
每个人可以随便“生产”数字人,甚至拥有自己的数字孪生(兄弟姐妹)的梦幻景象将成为现实,一切都将只是时间问题,甚至在可见的两三年内即可实现。数字人目前最先进的底层技术是什么样?已经在哪些商业场景和行业内有成熟应用?生成式AI将如何赋能数字人的发展?二者的交融会为元宇宙带来哪些新的想象?带着这些问题,我们采访和调研了国内6家代表性数字人服务商的创始团队,他们分别是一知智能、倒映有声、元境科技、拓元智慧、创想数维、宙予科技。本篇内容即是对访谈内容的全面和体系化呈现。
02主流数字人的技术原理和应用
目前国内的数字人技术厂商底层技术主要以NLP(NaturalLanguageProcessing自然语言处理)技术、多模态融合交互(不同形式的输入组合(例如,语音、手势、触摸、凝视等)被称为多模态交互模式,其目标是向用户提供与计算机进行交互的多种选择方式,以支持自然的用户选择。)和大模型(大模型又可以称为FoundationModel(基石)模型,模型通过亿级的语料或者图像进行知识抽取,学习进而生产了亿级参数的大模型。)、XR技术(ExtendedReality扩展现实,是指通过计算机将真实与虚拟相结合,打造一个可人机交互的虚拟环境,这也是AR、VR、MR等多种技术的统称。)这三种技术为底层技术依托打造数字人。
其中NLP技术以创始团队为浙江大学计算机学院人工智能研究所出身的一知智能、上市公司天娱数科战略投资的专门做元宇宙虚拟人相关业务的科技营销公司元境科技两家为典型代表。
一知智能
一知智能CTO李一夫在采访中表示,一知智能创始团队一开始就是研究NLP技术的,目前一知智能的智能客服等产品就是结合一知智能的NLP能力研发的。在持续探索商业化的过程中,一知智能研发团队也在积极关注和思考前沿技术的发展。
当一知智能研发团队认为多模态语音交互领域要想继续往前发展的话,就需要一个语音和文本结合、仿真外观形象和动态视频结合的模态,因此便在两年前便积极布局虚拟数字人,往多模态交互、多模态大模型的方向发展。
一知智能CTO李一夫向非凡产研记者介绍,与同行业产品对比中,尤其是在真人驱动以及口唇同步效果方面,一知智能的数字人在行业中应该是处于遥遥领先的状态。尤其在技术优势方面,由于一知智能过去几年积累了大量的语料,迭代出领先的消费行业语音与语义相关的模型,结合自身在多模块交互方面的研究沉淀,未来一知智能将会在数字人的基础上叠加交互的部分,从而扩大技术方面的竞争优势。
另一方面,一知智能过去在消费领域积累的客户、业务优势,将会使一知智能的数字人在帮助客户找PMF的应用中取得更大的竞争力。
元境科技
元境科技很早之前就开始布局NLP技术和应用,NLP核心的语义理解,预训练多模态大模型、NLP算法集、NLP开发套件等已经集成到了元享智能云平台,具备企业级的落地实力。元境科技创始人王智武表示,元境在做就是通过元境自身的研发实力,降低其他企业在NLP及其他尖端术在应用层的使用门槛。
元境科技的产品体系为1+X,其中“1”指元境科技自主研发的产品平台“元享”,通过这个平台元境科技将持续架设很多产品,聚焦垂直赛道和细分领域,同时提供专业产品服务和集成服务,简化和降低技术的应用门槛。元境科技目前的市场定位、探索主要聚焦在如何把一些最新自主训练技术、自主研发技术整合投放个一些垂直行业的应用场景。相比通用型产品,元境科技未来聚焦的方向将以垂直应用场景为主。
倒映有声
倒映有声成立四年多以来,则一直聚焦在多模态的驱动和生成技术。创始人兼CEO肖朔介绍说,倒映有声把文本、声音和图像,以及数字人相关的动作驱动几个环节整合到一起,形成“多模态的神经渲染引擎”。目前,倒映有声主要服务B端客户场景,提供AI数字人技术解决方案、可视化的操作界面、以及直接调取API技术接口,帮助客户去做数字人音频和视频内容生产,最终实现解放真人劳动力、降本增效的目的。
在倒映有声创始人兼CEO肖朔看来,目前的技术