項目簡介
Duix-Avator數字人(原項目名:HeyGem)是由硅基智能發佈的免費開源項目,專爲Windows系統設計,支持全離線視頻合成和數字人克隆。
核心功能
- 精準外貌克隆:使用先進AI算法高精度捕捉面部特徵,構建逼真的虛擬模型
- 聲音克隆:精確克隆聲音特徵,重現語音的細微特點,支持多種語音參數設置
- 文字/語音驅動:通過自然語言處理技術,將文本轉換爲自然流暢的語音來驅動虛擬形象
- 高效視頻合成:智能優化音視頻同步效果,實現自然流暢的脣形同步
- 多語言支持:支持英語、日語、韓語、中文、法語、德語、阿拉伯語、西班牙語等8種語言
技術優勢
- 全離線運行:無需聯網,有效保護用戶隱私,避免數據傳輸過程中的潛在泄露風險
- 操作簡單:界面簡潔直觀,即使無技術背景的初學者也能快速上手
- 多模型支持:支持導入多個模型,通過一鍵啓動包進行管理
- 跨平臺兼容:支持NVIDIA 50系列顯卡,已發佈Ubuntu版本
應用場景
- 虛擬主播和口播視頻製作
- 企業數字人客服
- 教育培訓虛擬講師
- 內容創作和營銷
- 個人IP數字化
技術架構
- ASR:基於fun-asr的自動語音識別技術
- TTS:基於fish-speech-ziming的語音合成技術
- 計算機視覺:用於人臉識別和脣動分析,確保虛擬形象脣形與語音內容匹配
開源地址:https://github.com/duixcom/Duix-Avatar
官方網址:https://duix.com
歷史名稱:HeyGem
加載中...