开源 · 本地优先 · 隐私安全

声绘

AI 语音创作工作台

把文本、音色、表演指令和语音标签变成可复用的声音作品。支持语音生成、音色设计、声音克隆,让每一段声音都独一无二。

查看源码
声绘音色库界面

核心功能

声绘提供完整的 AI 语音创作工具链,从文本到声音,一站式完成

AI 语音生成

输入文本即可生成高质量语音,支持历史记录、播放、下载和分享。

音色设计

通过文字描述设计独特音色,定义年龄、情绪、语速等多维特征。

声音克隆

上传或录制参考音频,克隆并保存为可复用的自定义音色。

表演指令

用自然语言描述表演风格,AI 会据此调整语音的情感和表达方式。

风格与音频标签

通过标签精细控制声音的风格、情绪和局部表达,让语音更具表现力。

历史记录管理

完整的历史记录,支持播放、下载、分享、删除和重新生成。

创建专属音色

两种方式创建音色:用文字描述设计全新音色,或上传音频克隆已有声音

设计音色

通过多维度文字描述生成独特音色。支持定义性别/年龄、音色/质感、情绪/语气、语速/节奏、角色/人设等特征。

性别/年龄音色/质感情绪/语气语速/节奏角色/人设说话风格

克隆音色

上传 10-30 秒清晰单人声参考音频,或直接录制,AI 将学习并克隆该声音特征。支持 mp3/wav 格式。

录制建议:安静环境、清晰人声、避免背景音乐和噪音
克隆音色界面

高级脚本与标签

通过标签系统精细控制语音的每一个细节,让 AI 理解你想要的表达方式

标签规则

(粤语 温柔)

风格标签

用于整段风格,建议放在文本最开头

[轻笑]

音频标签

用于局部表达,可插在任意句子前后

表演指令示例

// 表演指令

声音低沉沙哑一点,像个历经沧桑的老人在回忆往事,语速要慢,带着岁月感...

表演指令负责控制叙述口吻,正文只保留实际要合成的内容

高级案例界面

高级使用案例

点击案例查看表演指令、生成文本和内置试听,学习如何写出更好的语音生成文本

更多案例:

案例详情界面

隐私与开源

声绘采用本地优先设计,尊重用户隐私,代码完全开源

本地存储 API Key

所有 API 配置保存在设备本地,不经过任何第三方服务器

自配置服务

用户自行配置语音服务和文本优化服务,完全掌控数据流向

声音克隆合规

声音克隆仅限本人或已获授权的声音,请勿用于未授权用途

完全开源

项目基于 MIT 协议开源,可自行部署和二次开发

下载声绘

选择适合你的下载渠道,开始 AI 语音创作之旅

更新日志

自动同步 GitHub Releases,了解最新版本和更新内容