当前位置:首页 > 冰箱 > 文章正文

AI声音克隆 | Clone-voice用你声音自由生成创意语音内容(整合包)

编辑:[db:作者] 时间:2024-08-25 01:53:36

【更多免费AI工具,请点点关注】

AI声音克隆 | Clone-voice用你声音自由生成创意语音内容(整合包)

序言

当你不知足利用别人的音色(声音特色),而想利用自己的音色创作AIGC时,可以选择这个免费工具。

比如利用自己音色去读故事,读绘本,说英语,日语,法语,德语,唱歌,念诗,自我介绍,演讲等等等等,那就须要属于自己的语音模型文件。

一样平常AI声音克隆工具,如EmotiVoice,FastVitsV32,GPT-SoVITS,fish-speech,可以完成个人声音模型文件天生和TTS。

很多人就卡在了个人声音模型文件天生环节,由于要录演习音频素材,去噪,切割,标注,打码,推理…………,听着都头疼,对C端用户来说还是太麻烦。

推举

Clone-voice,是一款jianchang512开拓的令人惊叹的免费开源声音克隆工具,它可以克隆出任何人的声音,而且支持中文、英文、日语和韩语四种措辞。
最主要的是,这款工具利用非常简便,对电脑配置哀求也不高。

这是官网先容:A sound cloning tool with a web interface, using your voice or any sound to record audio / 一个带web界面的声音克隆工具,利用你的音色或任意声音来录制音频,将一段笔墨合成为利用该音色说话的声音,或者将一个声音利用该音色转换为另一个声音。

操作大略打开https://github.com/jianchang512/clone-voice/releases下载页面,下载预编译版主文件(1.7G) 和 模型(3G)下载后解压到某处,比如 E:/clone-voice 下双击 app.exe ,等待自动打开web窗口,请仔细阅读cmd窗口的笔墨提示,如有缺点,均会在此显示模型下载后在该项目根目录下的tts文件夹内解压,将压缩包内的文件夹复制到 tts 文件夹内,解压后该tts文件夹内会新增3个文件夹,分别是tts_models--multilingual--multi-dataset--xtts_v2voice_conversion_models--multilingual--vctk--freevc24wavlm转换操作步骤选择【笔墨->声音】按钮,在文本框中输入笔墨、或点击导入srt字幕文件,然后点击“立即开始”。
选择【声音->声音】按钮,点击或拖拽要转换的音频文件(mp3/wav/flac),然后从“要利用的声音文件”下拉框中选择要克隆的音色,如果没有满意的,也可以点击“本地上传”按钮,选择已录制好的5-20s的wav/mp3/flac声音文件。
或者点击“开始录制”按钮,在线录制你自己的声音5-20s,录制完成点击利用。
然后点击“立即开始”按钮如果机器拥有N卡GPU,并精确配置了CUDA环境,将自动利用CUDA加速下载地址

项目地址:https://github.com/jianchang512/clone-voice

Win软件包下载地址:

下载链接: https://pan.baidu.com/s/1YpvBYmKcogi1eA04FNjU3Q?pwd=9syeGitHub download: https://github.com/jianchang512/clone-voice/releases/download/v0.907/clone-voice-v0.907.7z

大模型文件下载地址:

https://pan.baidu.com/s/1CBnPmNElB3LHG7r_McAIwQ?pwd=61jc

【更多免费AI工具,请点点关注】

Linux Mac Window源码支配

有实力的同学可以源码支配,不限平台

源码版须要在 .env 中 HTTP_PROXY=设置代理(比如http://127.0.0.1:7890),要从 https://huggingface.co https://github.com 下载模型,而这个网址海内无法访问,必须担保代理稳定可靠,否则大模型下载可能中途失落败

哀求 python 3.9->3.11, 并且提前安装好 git-cmd 工具,下载地址创建空目录,比如 E:/clone-voice, 在这个目录下打开 cmd 窗口,方法是地址栏中输入 cmd, 然后回车。
利用git拉取源码到当前目录 git clone git@github.com:jianchang512/clone-voice.git .创建虚拟环境 python -m venv venv激活环境,win下 E:/clone-voice/venv/scripts/activate,安装依赖: pip install -r requirements.txt --no-deps, windows 和 linux 如果要启用cuda加速,连续实行 pip uninstall -y torch 卸载,然后实行pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu121。
(必须有N卡并且配置好CUDA环境)win下解压 ffmpeg.7z,将个中的ffmpeg.exe和app.py在同一目录下, linux和mac 到 ffmpeg官网下载对应版本ffmpeg,解压个中的ffmpeg程序到根目录下,必须将可实行二进制文件 ffmpeg 和app.py放在同一目录下。
首先运行 python code_dev.py ,在提示赞许协议时,输入 y,然后等待模型下载完毕。
下载模型须要挂全局代理,模型非常大,如果代理不足稳定可靠,可能会碰着很多缺点,大部分的缺点均是代理问题导致。
如果显示下载多个模型均成功了,但末了还是提示“Downloading WavLM model”缺点,则须要修正库包文件 \venv\Lib\site-packages\aiohttp\client.py, 在大约535行附近,if proxy is not None: 上面一行添加你的代理地址,比如 proxy="http://127.0.0.1:10809".下载完毕后,再启动 python app.py【演习解释】 如果想演习,实行 python train.py, 演习参数在 param.json中调度,调度后重新实行演习脚本python train.py每次启动都会连接墙外检测或更新模型,请耐心等待。
如果不想每次启动都检测或更新,需手动修正依赖包下文件,打开 \venv\Lib\site-packages\TTS\utils\manage.py ,大约 389 行附近,def download_model 方法中,注释掉如下代码

if md5sum is not None:md5sum_file = os.path.join(output_path, "hash.md5")if os.path.isfile(md5sum_file): with open(md5sum_file, mode="r") as f:if not f.read() == md5sum: print(f" > {model_name} has been updated, clearing model cache...") self.create_dir_and_download_model(model_name, model_item, output_path)else: print(f" > {model_name} is already downloaded.")else: print(f" > {model_name} has been updated, clearing model cache...") self.create_dir_and_download_model(model_name, model_item, output_path)源码版启动时可能频繁碰着缺点,基本都是代理问题导致无法从墙外下载模型或下载中断不完全。
建议利用稳定的代理,全局开启。
如果始终无法完全下载,建议利用预编译版。

也有付费的同类产品,也可以关注:https://www.clonevoice.net/。

【更多免费AI工具,请点点关注】

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/bx/70107.html

XML地图 | 自定链接

Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码

声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com