Audiocraft音频生成深度学习库

联合创作 · 2023-09-29 19:44

Audiocraft 是用于音频生成的深度学习库。它使用深度学习进行音频处理和生成，具有最先进的 EnCodec 音频压缩器/分词器，以及 MusicGen——简单且可控的音乐生成大模型，具有文本和旋律调节功能。

运行 Audiocraft 的环境要求：

Python 3.9
PyTorch 2.0.0
内存至少为 16 GB 的 GPU（对于中型模型）

如需安装 Audiocraft，运行以下命令：

# Best to make sure you have torch installed first, in particular before installing xformers.
# Don't run this if you already have PyTorch installed.
pip install 'torch>=2.0'
# Then proceed to one of the following
pip install -U audiocraft  # stable release
pip install -U git+https://git@github.com/facebookresearch/audiocraft#egg=audiocraft  # bleeding edge
pip install -e .  # or if you cloned the repo locally

浏览 5

点赞

收藏

分享

举报

评论

图片

表情

Audiocraft音频生成深度学习库

Audiocraft是用于音频生成的深度学习库。它使用深度学习进行音频处理和生成，具有最先进的EnCodec音频压缩器/分词器，以及MusicGen——简单且可控的音乐生成大模型，具有文本和旋律调节功

HebelGPU 加速深度学习库

Hebel 是一款用 Python 编写的支持 GPU 加速的深度学习库。Hebel 是一个通过 P

fastai深度学习实践库

fastai库使用现代最佳实践简化了快速准确的神经网络训练。它基于对fast.ai深度学习最佳实践的研究，包括对vision，text，tabular和collab（协作过滤）模型的“开箱即用”支持。

Deeplearning4j分布式深度学习库

Deeplearning4j（简称DL4J）是为Java和Scala编写的首个商业级开源分布式深度学

深度学习PyTorch库介绍

目标检测与深度学习

生成对抗网络详解 |深度学习

七月在线实验室

HebelGPU 加速深度学习库

Hebel是一款用Python编写的支持GPU加速的深度学习库。Hebel是一个通过PyCUDA库使用GPUCUDA来加速建立神经网络的深度学习库。它实现了几类最重要的神经网络模型，提供各种激活函数和

Gluon API深度学习库

Gluon 是微软联合亚马逊推出的一个开源深度学习库，这是一个清晰、简洁、简单但功能强大的深度学习

EnCodec基于深度学习的音频编解码器

EnCodec是一个基于深度学习的音频编解码器，由AI驱动，可以在音频质量没有损失的前提下，将音频压缩到比MP3格式还要小10倍的程度。实现过程如下：首先，编码器将未压缩的数据转换为较低帧率的"lat

EnCodec基于深度学习的音频编解码器

EnCodec 是一个基于深度学习的音频编解码器，由 AI 驱动，可以在音频质量没有损失的前提下，将

点赞

收藏

分享

举报