当前位置:首页 > 燃气灶 > 文章正文

超越先前最佳阿里通义千问开源Qwen2-Audio 7B语音交互大年夜模型

编辑:[db:作者] 时间:2024-08-25 01:40:48

作为一个大规模音频措辞模型,Qwen2-Audio 能够接管各种音频旗子暗记输入,并根据语音指令实行音频剖析或直接相应文本,有两种不同的音频交互模式:

语音谈天:用户可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入

超越先前最佳阿里通义千问开源Qwen2-Audio 7B语音交互大年夜模型

音频剖析:用户可以在互动过程中供应音频和文本指令对音频进行剖析

官方在一系列基准数据集上进行了测试,Qwen2-Audio 超越了先前的最佳模型。

▲ Qwen2-Audio 整体表现

IT之家附干系链接如下:

试用链接:https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo

论文地址:https://arxiv.org/abs/2407.10759

评估标准:https://github.com/OFA-Sys/AIR-Bench

开源代码:https://github.com/QwenLM/Qwen2-Audio

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/rqz/66047.html

XML地图 | 自定链接

Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码

声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com