IT世界网 >> 热点

热点

支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源

   时间:2025-04-03 00:37   来源:科技快报网   阅读量:9648   

在当今数字化时代,语音识别技术已成为人机交互的关键桥梁,广泛应用于智能客服、语音助手、会议转录等众多领域。然而,对于东方语言的识别如越南语、缅甸语等,现有模型往往表现不佳,难以满足用户的需求。为解决这一难题,海天瑞声携手清华大学电子工程系语音与音频技术实验室,共同推出了Dolphin —— 一款专为东方语言设计的语音大模型。

Dolphin核心亮点:

· 支持东方40个语种的语音识别,中文语种支持22方言;

· 训练数据总时长21.2万小时:其中海天瑞声高质量专有数据13.8万小时,开源数据7.4万小时;

· 在3个测试集下,与Whisper同等尺寸模型相比:

- base版本平均WER降低63.1%;

- small版本平均WER降低68.2%;

- medium版本平均WER降低67.7%;

- large版本平均WER降低60.6%

·base与small版本模型与推理代码全面开源;Dolphin 开源的small版本与Whisper large v3相比,平均WER降低54.1%。

Dolphin的开源只是起点。未来,海天瑞声与清华大学电子工程系语音与音频技术实验室将继续探索更大规模模型的训练,以实现更广泛的语言覆盖和更卓越的性能。同时,我们也将优化模型以适应低延迟和实时应用场景,使其在更多领域发挥价值。此外,海天瑞声计划进一步加大对稀缺语言语种数据集的研发支持,为全球语音识别技术的均衡发展贡献力量。

Dolphin不仅是一款技术先进的语音识别模型,更是推动东方语言语音识别技术发展的重要力量。海天瑞声期待与全球研究者和开发者共同携手,开创语音识别技术的新篇章。

欢迎前往Github、HuggingFace、Modelscope、OpenI启智社区等社区搜索「Dolphin」进行体验~!

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

  • 宝马中国联合华为终端深度融合鸿蒙生态开启智能出行新体验
    宝马中国联合华为终端深度融合鸿蒙生态开启

    在科技飞速发展的今天,汽车智能化已然成为行业发展不可逆转的必然趋势。宝马中国与华为终端的合作,宛如两颗璀璨星辰在浩瀚宇宙中交汇,为汽车智能互联领域带来了全新的曙光和无限可能。宝马,一直以来凭借其卓越的驾驶操控性能,无论是在蜿蜒的山路还是平坦...

  • 汽车行业首批增程器综合性能认证自主品牌技术实力彰显
    汽车行业首批增程器综合性能认证自主品牌技

    在汽车行业技术不断迭代升级的进程中,增程器领域传来了令人振奋的消息。中国汽车工程研究院股份有限公司联合中国质量认证中心有限公司颁发了汽车行业首批“乘用车增程器综合性能之星”认证证书,这一举措在汽车行业发展历程中具有里程碑式的意义。此次认证基...

  • 怎么选购电动叉车呢?易工机械分享几个要点
    怎么选购电动叉车呢?易工机械分享几个要点

    电动叉车是现代物流行业中的重要设备之一,与传统的燃油叉车相比,它具有更好的环保性、低噪音、更低的维护成本、操作简便、节省时间和更高的安全性等优势。但在选购电动叉车时,需要考虑以下几个方面:一、载货能力叉车的载货能力是一个非常重要的指标。在选...

  • 不断创“芯”,亚略特为行业高质量发展提供强劲动能
    不断创“芯”,亚略特为行业高质量发展提供

    近日,由深圳市芯片行业协会联合凤凰网举办的“新时代芯未来“全球芯片产业链发展高峰论坛在深圳前海万科国际会议中心成功召开。亚略特作为杰出企业代表之一受邀参与了此次峰会,并凭借在多模态生物识别核心技术上的不断创新,以及芯片研发领域的持续突破,获...