
文章来源: 更新时间:2025-01-28 12:50:07
声明:本人是智能语音交互方向的研究生新生,兴趣方向为语音合成/音乐生成。
本文是个人研读论文后的笔记,目前只从脉络层面了解相关技术,并不深入模型框架和细节,是对相关技术前言知识的了解和科普。
欢迎交流指正!(持续更新) 1 Stable Audio(2405)标题《Fast Timing-Conditioned Latent Audio Diffusion》 关注点:快速、时间条件 怎么做到快速的?时间条件是怎么嵌入网络的? 摘要从文本提示生成长格式 44.1kHz 立体声音频…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: