
核心功能
声绘提供完整的 AI 语音创作工具链,从文本到声音,一站式完成
AI 语音生成
输入文本即可生成高质量语音,支持历史记录、播放、下载和分享。
音色设计
通过文字描述设计独特音色,定义年龄、情绪、语速等多维特征。
声音克隆
上传或录制参考音频,克隆并保存为可复用的自定义音色。
表演指令
用自然语言描述表演风格,AI 会据此调整语音的情感和表达方式。
风格与音频标签
通过标签精细控制声音的风格、情绪和局部表达,让语音更具表现力。
历史记录管理
完整的历史记录,支持播放、下载、分享、删除和重新生成。
创建专属音色
两种方式创建音色:用文字描述设计全新音色,或上传音频克隆已有声音
设计音色
通过多维度文字描述生成独特音色。支持定义性别/年龄、音色/质感、情绪/语气、语速/节奏、角色/人设等特征。
性别/年龄音色/质感情绪/语气语速/节奏角色/人设说话风格
克隆音色
上传 10-30 秒清晰单人声参考音频,或直接录制,AI 将学习并克隆该声音特征。支持 mp3/wav 格式。
录制建议:安静环境、清晰人声、避免背景音乐和噪音

高级脚本与标签
通过标签系统精细控制语音的每一个细节,让 AI 理解你想要的表达方式
标签规则
(粤语 温柔)
风格标签
用于整段风格,建议放在文本最开头
[轻笑]
音频标签
用于局部表达,可插在任意句子前后
表演指令示例
// 表演指令
声音低沉沙哑一点,像个历经沧桑的老人在回忆往事,语速要慢,带着岁月感...
表演指令负责控制叙述口吻,正文只保留实际要合成的内容

高级使用案例
点击案例查看表演指令、生成文本和内置试听,学习如何写出更好的语音生成文本
更多案例:

隐私与开源
声绘采用本地优先设计,尊重用户隐私,代码完全开源
本地存储 API Key
所有 API 配置保存在设备本地,不经过任何第三方服务器
自配置服务
用户自行配置语音服务和文本优化服务,完全掌控数据流向
声音克隆合规
声音克隆仅限本人或已获授权的声音,请勿用于未授权用途
完全开源
项目基于 MIT 协议开源,可自行部署和二次开发
更新日志
自动同步 GitHub Releases,了解最新版本和更新内容
