← 返回合成工具

MiMo TTS Studio

基于小米 MiMo-V2.5-TTS 系列模型的在线语音合成工具

项目简介

MiMo TTS Studio 是一个基于小米 MiMo-V2.5-TTS 系列模型打造的在线语音合成工具。 它提供了直观友好的用户界面,让用户能够轻松地将文本转换为自然流畅的语音。

无论您是内容创作者、开发者还是普通用户,都可以通过 MiMo TTS Studio 快速生成高质量的语音内容,用于视频配音、有声读物、语音助手等多种场景。

三大核心功能

🎤

内置音色选择

9 种精心调校的内置音色,覆盖中英文、男女声。包括冰糖、茉莉、苏打、白桦等中文音色, 以及 Mia、Chloe、Milo、Dean 等英文音色。选择音色,输入文本,即可快速生成语音。

🎨

声音设计

通过自然语言描述来设计独特的声音。只需描述您想要的声音特征, 如"温柔的女声"、"活力的少年音",AI 就能为您生成相应的声音。

🔊

声音克隆

上传一段音频样本(支持 WAV / MP3),AI 就能复刻该声音的音色特征。 适合需要保持声音一致性的场景,如系列视频、品牌语音等。

风格标签系统

使用风格标签可以精确控制语音的情感、语速、语调等特征,让合成语音更加生动自然

情绪标签(插入到文本开头)

(开心)欢快愉悦
(悲伤)低沉忧伤
(愤怒)激动愤怒
(温柔)柔和亲切
(慵懒)随意放松
(磁性)低沉有磁性
(甜美)甜美可爱
(严肃)正式庄重
(活泼)活力充沛
(低沉)沉稳厚重
(冷淡)冷淡疏离
(激动)热情激昂

方言 / 角色标签

(东北话)(四川话)(河南话)(粤语)(唱歌)(夹子音)(大叔音)(御姐音)

音频效果标签(可插入文本任意位置)

[深吸一口气][叹气][轻声笑][大笑][啜泣][颤抖][咳嗽][停顿]

丰富功能

流式合成

PCM16 流式实时传输,快速获取音频

🎯

高质量输出

24kHz 采样率,WAV 格式完整输出

📦

批量合成

上传 TXT 文件,逐行合成,ZIP 打包下载

🧹

文本预处理

去空格、去换行、智能分段、自动标点

📊

字数统计

实时统计中英文字数,预估合成时长

🎵

波形可视化

播放时实时显示频谱波形

📋

合成历史

自动保存 20 条记录,支持搜索和筛选

📥

批量下载

历史记录支持 ZIP 批量下载

📤

数据导出

历史记录导出为 JSON / CSV 格式

⚙️

设置管理

一键导入/导出/重置配置

音色收藏

收藏常用音色,记录使用统计

💾

持久化存储

localStorage 保存配置,IndexedDB 存储音频数据

💡

示例文本

内置 6 条风格示例,一键填入

📄

文件上传

支持上传 TXT 文件导入文本

⌨️

快捷键

Ctrl+Enter 合成,? 查看快捷键

🌙

主题切换

支持暗色/亮色/跟随系统三种模式

玻璃拟态

Ant Design 玻璃拟态主题,视觉体验出众

👋

新手引导

首次使用 5 步交互式引导教程

🔔

Toast 通知

操作反馈通过弹窗提示

技术栈

Next.js 16React 19TypeScript 6Ant Design 6Tailwind CSS 4MiMo-V2.5-TTSSSE 流式传输Web Audio APIJSZiplocalStorageIndexedDBPrettierHusky

使用场景

视频配音

为短视频、教程、宣传片添加专业配音

有声读物

将文字内容转换为有声书,解放双眼

语音助手

为智能设备和应用定制独特的语音

在线教育

制作教学音频,提升学习体验

游戏开发

为游戏角色生成个性化语音

无障碍服务

为视障用户提供语音辅助功能

快速开始

1

获取 API Key

访问 platform.xiaomimimo.com 注册并获取您的 API Key

2

配置 API

在工具中输入您的 API Key(自动保存,下次无需重复输入)

3

选择模式

根据需求选择内置音色、声音设计或声音克隆模式

4

输入文本

输入要合成的文本,可添加风格标签控制语音效果,或使用示例文本快速体验

5

生成语音

点击"合成语音"按钮(或按 Ctrl+Enter),等待生成完成即可播放和下载

MiMo TTS Studio · 基于小米 MiMo-V2.5-TTS 系列模型

© 2026 MiMo TTS Studio. All rights reserved.