随着 AIGC、3D 建模、文生视频等技术发展,虚拟数字人能够通过智能交互协助企业进行知识传递、互动问答、智能咨询、产品推介、服务导览等;相较于真人,有「及时反馈互动性高、全天候服务、个性化和定制化、跨文化跨语言传播、成本低效益高」等优势。
本次调研围绕「数字人交互视频创作」领域,专注于分析其海外市场情况、竞争产品、客户分析、可行性等。
一、行业背景整体而言,数字人交互视频所处于的完整数字人企业服务市场规模:市场规模 44 亿美元、复合年增长率 37.9%。
其核心应用场景面向于互动式在线教育与培训、客户服务与产品介绍、虚拟会议与客户交流、个性化营销与广告、虚拟导览与沉浸式体验、虚拟面试与招聘、健康咨询与支持等。这些场景的内容共性均为预置内容确定、面向受众的通用性强,同时其服务属性偏向于互动范围基于预置内容为主,角色属性强烈的场景。
二、市场概述首先明确本次调研的市场范围:面向企业服务的海外数字人交互视频创作类产品,既能支持数字人讲解 PPT、又能交互性问答。
2.1 主要参与者(海外)
同时补充下国内主要参与者以及其他相关方向厂商(如互动式 PPT 讲解):
2.2 市场现状
主要参与者的企业经营现状中,从 2017-2024 陆续都有融资,金额约在千万级别,正在从早期的市场验证向更大规模的运营过渡,员工人数平均约在 50-100,收费模式订阅制为主、约几十美元 / 月,同时,chatGPT 预估这些厂商的平均客户为数百个、个别数千个。
市面上暂无直接相关的投融资数据,只有从侧面进行收集:Y Combinator 近 3 年,暂无数字人创投项目,有个别语音 / 文字对话项目;ProductHunt 上搜数字人相关,基本也是以生成数字人视频类对主;企查查上搜「虚拟人」「数字人」「人工智能 视频」融资事件,面向本细分领域的较少。整体而言,数字人目前投融资不是非常热门。
三、产品调研经过对以下7款产品的详细调研:
有如下关键调研发现:
需求范围广:
除了美国外,韩国、欧洲、新西兰、以色列等国家均有类似产品涉及,说明需求覆盖度相对全球化、通用化
核心产品形态和流程类似:
选择创建方式(文本 / 图片 / URL/PPT/PDF 或模板,来生成视频)
进入视频配置页:配置语音、语言、脚本、屏幕、手势
视频高级设置:配乐等
视频导出 / 分享
产品能力区别在于:
声音、语音、语言、AI 头像支持的数量和质量程度不同
个别有团队素材管理能力、利于团队管理
个别有更易分享到其他平台的打通能力
3 种形态厂商侧重点发现:
只能支持数字人讲解 PPT 视频,不支持问答的产品:因为真人只是内容一小部分,因此拟人程度较弱,更发力在内容在多个维度的预置丰富程度上
只能支持数字人交互性问答的产品:真人在内容几乎占全屏,拟人能力极强、支持高度定制化
二者都能支持,但功能是独立的的产品:注重在数字人交互领域各种能力的丰富度,不仅有视频生成,还有视频翻译(例如给一个中文真人视频换上英文的口音和嘴形)等能力
在以下3类场景中,教育培训与产品介绍整体实现门槛低、数字人需求诉求高;客户服务数字人诉求一般、实现门槛高;内容营销数字人诉求高、模板 / 行业要求高。同时,数字人行业目前仍旧存在用户对虚拟人的接受程度、企业定制化要求程度高的问题。
五、实现可行性结论:核心技术不建议自研,调用现有开源技术初步实现难度不大,但是要定制和精细还是需要非常资深的相关技术。
核心产品架构参考:
商汤如影平台架构图(2024 大模型赋能下的 AI-2.0 数字人平台白皮书_商汤科技_2024-1.pdf)
- 戴尔:利用 uneeq 数字人服务商搭建自己的数字人服务(戴尔 dell:设计指南 —— 企业中的生成式人工智能数字助理.pdf)
综合前述调研,整体而言,鉴于市场的增长潜力和用户真实存在的需求,该方向可行度较高。
在打法策略上,前期重点面向教育培训与产品介绍(拟人要求低、数字人诉求高),与教育机构、企业服务提供商等建立合作,共同开发市场,后续再铺开客户服务(拟人技术要求高)、短视频营销(模板要求高、语音 / 语言 / 头像等维度要求复杂)。
在具体实现上,技术可调用开源和现有技术,开发既能支持数字人讲解 PPT、又能交互性问答的产品;但同时产品也需要上手难度要够低、交互要够简单(因为面向的人群本身都不是很擅长做相关配置的角色,是一种新的产品试用习惯培育过程)。
以上就是关于数字人交互视频创作类产品放逐爱情全部的内容,关注我们,带您了解更多相关内容。
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。