开源 · 本地优先 · 隐私安全

声绘

AI 语音创作工作台

把文本、音色、表演指令和语音标签变成可复用的声音作品。支持语音生成、音色设计、声音克隆，让每一段声音都独一无二。

查看源码

核心功能

声绘提供完整的 AI 语音创作工具链，从文本到声音，一站式完成

AI 语音生成

输入文本即可生成高质量语音，支持历史记录、播放、下载和分享。

音色设计

通过文字描述设计独特音色，定义年龄、情绪、语速等多维特征。

声音克隆

上传或录制参考音频，克隆并保存为可复用的自定义音色。

表演指令

用自然语言描述表演风格，AI 会据此调整语音的情感和表达方式。

风格与音频标签

通过标签精细控制声音的风格、情绪和局部表达，让语音更具表现力。

历史记录管理

完整的历史记录，支持播放、下载、分享、删除和重新生成。

创建专属音色

两种方式创建音色：用文字描述设计全新音色，或上传音频克隆已有声音

设计音色

通过多维度文字描述生成独特音色。支持定义性别/年龄、音色/质感、情绪/语气、语速/节奏、角色/人设等特征。

性别/年龄音色/质感情绪/语气语速/节奏角色/人设说话风格

克隆音色

上传 10-30 秒清晰单人声参考音频，或直接录制，AI 将学习并克隆该声音特征。支持 mp3/wav 格式。

录制建议：安静环境、清晰人声、避免背景音乐和噪音

高级脚本与标签

通过标签系统精细控制语音的每一个细节，让 AI 理解你想要的表达方式

标签规则

(粤语温柔)

风格标签

用于整段风格，建议放在文本最开头

[轻笑]

音频标签

用于局部表达，可插在任意句子前后

表演指令示例

// 表演指令

声音低沉沙哑一点，像个历经沧桑的老人在回忆往事，语速要慢，带着岁月感...

表演指令负责控制叙述口吻，正文只保留实际要合成的内容

高级使用案例

点击案例查看表演指令、生成文本和内置试听，学习如何写出更好的语音生成文本

更多案例：

隐私与开源

声绘采用本地优先设计，尊重用户隐私，代码完全开源

本地存储 API Key

所有 API 配置保存在设备本地，不经过任何第三方服务器

自配置服务

用户自行配置语音服务和文本优化服务，完全掌控数据流向

声音克隆合规

声音克隆仅限本人或已获授权的声音，请勿用于未授权用途

完全开源

项目基于 Apache-2.0 协议开源，可自行部署和二次开发

下载声绘

选择适合你的下载渠道，开始 AI 语音创作之旅

GitHub Releases

官方发布渠道

百度网盘

提取码: 6kxy

夸克网盘

国内高速下载

GitHub 仓库

更新日志

自动同步 GitHub Releases，了解最新版本和更新内容

声绘