当前位置：首页 > 燃气灶 > 文章正文

超越先前最佳阿里通义千问开源Qwen2-Audio 7B语音交互大年夜模型

编辑：[db:作者] 时间：2024-08-25 01:40:48

作为一个大规模音频措辞模型，Qwen2-Audio 能够接管各种音频旗子暗记输入，并根据语音指令实行音频剖析或直接相应文本，有两种不同的音频交互模式：

语音谈天：用户可以自由地与 Qwen2-Audio 进行语音互动，而无需文本输入

音频剖析：用户可以在互动过程中供应音频和文本指令对音频进行剖析

官方在一系列基准数据集上进行了测试，Qwen2-Audio 超越了先前的最佳模型。

▲ Qwen2-Audio 整体表现

IT之家附干系链接如下：

试用链接：https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo

论文地址：https://arxiv.org/abs/2407.10759

评估标准：https://github.com/OFA-Sys/AIR-Bench

开源代码：https://github.com/QwenLM/Qwen2-Audio

本站所发布的文字与图片素材为非商业目的改编或整理，版权归原作者所有，如侵权或涉及违法，请联系我们删除，如需转载请保留原文地址：http://www.baanla.com/rqz/66047.html