项目简介
Duix-Avator数字人(原项目名:HeyGem)是由硅基智能发布的免费开源项目,专为Windows系统设计,支持全离线视频合成和数字人克隆。
核心功能
- 精准外貌克隆:使用先进AI算法高精度捕捉面部特征,构建逼真的虚拟模型
- 声音克隆:精确克隆声音特征,重现语音的细微特点,支持多种语音参数设置
- 文字/语音驱动:通过自然语言处理技术,将文本转换为自然流畅的语音来驱动虚拟形象
- 高效视频合成:智能优化音视频同步效果,实现自然流畅的唇形同步
- 多语言支持:支持英语、日语、韩语、中文、法语、德语、阿拉伯语、西班牙语等8种语言
技术优势
- 全离线运行:无需联网,有效保护用户隐私,避免数据传输过程中的潜在泄露风险
- 操作简单:界面简洁直观,即使无技术背景的初学者也能快速上手
- 多模型支持:支持导入多个模型,通过一键启动包进行管理
- 跨平台兼容:支持NVIDIA 50系列显卡,已发布Ubuntu版本
应用场景
- 虚拟主播和口播视频制作
- 企业数字人客服
- 教育培训虚拟讲师
- 内容创作和营销
- 个人IP数字化
技术架构
- ASR:基于fun-asr的自动语音识别技术
- TTS:基于fish-speech-ziming的语音合成技术
- 计算机视觉:用于人脸识别和唇动分析,确保虚拟形象唇形与语音内容匹配
开源地址:https://github.com/duixcom/Duix-Avatar
官方网址:https://duix.com
历史名称:HeyGem
加载中...