北科瑞声私域语音大模型VoiceGPT,基于AI+智能语音能力,搭载大型的声学模型、语言模型、声学事件处理模型和专业知识库,基于“云+芯+自进化”的核心能力框架,通过多模态语音交互技术,实现第五代人交互技术——自然人机交互,为未来各种信息系统提供新一代的信息接口。
两文三语语音实时和文件转写,中英文混合语音识别
秒级快速热词自学习
情感语音合成,多风格语音合成
快速语音复刻
有监督和无监督说话人分离
关键信息抽取,意图理解,多轮对话管理
声学场景判断(ASC),声音事件检测(AED)噪声监测
工业设备声纹检测,声学成像
两文三语语音实时和文件转写,中英文混合语音识别
秒级快速热词自学习
情感语音合成,多风格语音合成
快速语音复刻
有监督和无监督说话人分离
关键信息抽取,意图理解,多轮对话管理
声学场景判断(ASC),声音事件检测(AED)噪声监测
工业设备声纹检测,声学成像
电话: 0755-86329312
邮箱: contact@raisound.com
地址: 深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园3栋1201-6