编辑:[db:作者] 时间:2024-08-25 01:40:48
作为一个大规模音频措辞模型,Qwen2-Audio 能够接管各种音频旗子暗记输入,并根据语音指令实行音频剖析或直接相应文本,有两种不同的音频交互模式:
语音谈天:用户可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入
音频剖析:用户可以在互动过程中供应音频和文本指令对音频进行剖析
官方在一系列基准数据集上进行了测试,Qwen2-Audio 超越了先前的最佳模型。
▲ Qwen2-Audio 整体表现
IT之家附干系链接如下:
试用链接:https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo
论文地址:https://arxiv.org/abs/2407.10759
评估标准:https://github.com/OFA-Sys/AIR-Bench
开源代码:https://github.com/QwenLM/Qwen2-Audio
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/rqz/66047.html
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com