Stability AI 又悄悄放出一个大招,这次不再是由文字生成图片,而是由文字生成音乐!而且还是开源的!
这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍2种使用方法
1.最简单,在线使用:
https://stableaudio.com/
2.手动安装
首先,将存储库克隆到本地机器:
git clone https://github.com/RoyalCities/RC-stable-audio-tools
cd RC-stable-audio-tools
创建虚拟环境
Windows :
python -m venv venv
venv\Scripts\activate
macOS 和 Linux:
python3 -m venv venv
source venv/bin/activate
安装所需的软件包
安装稳定的音频工具和必要的软件包setup.py:
pip install stable-audio-tools
pip install .
Windows 用户的额外步骤
为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新
安装torch、,torchvision并torchaudio使用正确的 CUDA 版本:
pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
配置
config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):
{
"model_directory": "models",
"output_directory": "generations"
}
使用方法
运行 Gradio 界面
使用批处理文件或直接从命令行启动 Gradio 界面:
批处理文件示例:
@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause
或命令行:
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
🎶 生成音频和 MIDI
Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json。
该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。
模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。
要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。
ppt.cc/fVjECx ppt.cc/fEnHsx ppt.cc/fRZTnx ppt.cc/fSZ3cx ppt.cc/fLOuCx ppt.cc/fE9Nux ppt.cc/fL5Kyx ppt.cc/fIr1ax ppt.cc/f71Yqx tecmint.com linuxcool.com linux.die.net linux.it.net.cn ostechnix.com unix.com ubuntugeek.com runoob.com man.linuxde.net bit.ly/2EzoUDo bit.ly/2tW6eYT bit.ly/2X6vadl bit.ly/2viLpHU linuxprobe.com linuxtechi.com howtoforge.com linuxstory.org systutorials.com ghacks.net linuxopsys.com v.gd/2P9wTx v.gd/FtfpqE v.gd/eMfHsm v.gd/Ub7mqv v.gd/RReVk0 v.gd/vS3uTI v.gd/4Zxmba
Total Pageviews
Wednesday, 28 August 2024
Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!Stability AI 放大招! 免费开源 Stable Audio,文本转音乐就这么简单
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment