技术参数 | 1.口型匹配准确度大于95%;
2.最高分辨率支持4K;
3.支持数字人走动;
4.支持数字人持物;
5.支持眼神矫正;
6.支持视频制作动作编排;
7.一分钟音频合成时长不超过15秒;
8.MOS分4.2+;
9.支持语音泛化,一个模型支持多个语言;
10.支持局部变速,多音字、别名、连读等语音编辑能力;
11.4K画质合成速度为1:6.1080画质合成速度为1:1.5;
12.预制音频110种;
13.预制模特形象超过100+;
14.预制模板22个;
15.最长视频支持60分钟;
16.有敏感词检测;
17.支持本地导入,单段音频驱动;
18.支持素材类型背景/数字人/ppt/图片/视频/音乐/贴纸/文本;
19.支持在线预览(数字人嘴型不会动)。 |