虚拟人制作形态:虚拟人制作技术及其在市场上的形态,可总结出一套通用系统框架。由于虚拟人的发展尚处于成长阶段,目前仍未形成统一的系统框架,但根据虚拟人制作技术及其在市场上的形态,人工智能产业发展联盟总结出了一套通用系统框架。根据该框架,虚拟人一般由五个模块构成,其中人物形象基于建模技术,语音生成模块基于AI技术,动画生成模块基于动作捕捉或AI技术,音视频合成显示模块将语音和动画部分结合以呈现给用户;交互模块为扩展项,一些侧重于展示的虚拟人不具备交互能力(如小红书、微博等平台上的虚拟KOL),而强调交互的虚拟人可通过语音语义识别等AI技术或真人操控来完成与用户的交互。虚拟人可以通过语音识别和自然语言处理技术理解用户的指令和问题。武汉虚拟人IP矩阵方案
虚拟人技术方案:虚拟人产业链由技术方案(基础层、平台层)与内容应用构成,其中基础层已形成稳固格局,应用层新锐企业崭露头角。虚拟人产业链从下至上可分为基础层、平台层、应用层,其中基础层为虚拟人的制作提供基础设施,例如芯片对传感器所采集的数据进行预处理并渲染模型,渲染引擎进一步优化灯光、毛发等细节,平台层中的软硬件系统企业从基础层获取数据信息后通过软件算法重现人物动作,生产技术服务平台提供一站式虚拟人解决方案,AI能力平台提供交互技术能力,在基于以上技术方案构建好虚拟人的“外壳”以后,部分虚拟人还需内容运营企业为其注入“灵魂”,而后应用于影视、传媒、游戏、金融等领域,近年来应用层涌现出众多新锐企业。3D虚拟人制作流程生成式AI技术是创建AI数字人的重要工具之一。
什么是虚拟人?虚拟人指的是采用图形渲染、动作捕捉、深度学习等计算机技术构建的,以代码形式运行的,并具有外貌特征等多重人类特征的综合体。广义上讲,虚拟人、数字人、虚拟数字人均指通过现代计算机技术构建的拟人化形象,他们被赋予鲜明的人物设定,以代码与数据的形式在计算设备上运行。狭义上来说,虚拟人更注重外观与真人的相似性;数字人强调其存在于二进制的数字世界中,既能够按照真人生成的1:1数字孪生,也能够进行完全虚构的形象与身份。
虚拟人市场广阔,应用领域不断拓展:虚拟人从比较早的手工绘制到现在的CG、人工智能合成,虚拟人大致经历了萌芽、探索、初级和成长四个阶段。当前虚拟人技术日益成熟,应用范围不断扩大,其产业链主要分为上游基础层、中游平台层、下游应用层。基础层为虚拟人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建模软件、渲染引擎。处于基础层的厂商深耕行业多年,形成了深厚的技术壁垒。平台层包括软硬件系统、生产技术服务平台、AI能力平台,为虚拟人的制作及开发提供技术能力,赋予其真实及灵动感。虚拟人可以被用于各种领域,如教育、医疗、娱乐等,具有很多的应用前景。
虚拟人的技术:声音转换技术,可以让后台真人替换,而面对虚拟人的人感知不到。声音转换基于深度学习和迁移学习技术,准确将原说话人的声音转换为目标说话人,同时保留原说话人的风格特色。让声音有更多的表现形式。NLG与NLU等算法,这一块表示着数字人的关键——智能。NLU让AI能够理解人类的语言,NLG则让AI能够思考、输出并与人类交互。国际上这几年的超大预训练模型发展很迅速,人工智能技术的发展将会推动数字人的进一步智能化,多场景运用。虚拟人可以通过人脸识别技术识别用户的身份和表情。广州国内虚拟人
虚拟人可以通过情感识别技术感知用户的情绪并作出相应的回应。武汉虚拟人IP矩阵方案
虚拟人可以如何应用?虚拟人和数字人的应用领域多样化,主要的娱乐和服务行业。在屏幕呈现方法日益成熟的基础下,叠加5G,算力和AI等技术能力的提高以及其落地场景变得越来越丰富。如今,它不再限于影视和动画等传统娱乐领域在虚拟形象塑造的应用程序。它还实现了社交,游戏,办公和其他场景中真实人类的虚拟化身身份功能,并逐渐实现电子商务,偶像明星,陪伴服务以及其他AI虚拟人领域的商业货币化。虚拟人可以从功能和价值上大致分为三类:第1类是传播媒体,例如虚拟明星,偶像,锚实和主播;第二类是专业服务价值,如虚拟**,医生,老师,员工等。第三种类型是生活伴侣,例如虚拟宠物和亲戚。武汉虚拟人IP矩阵方案