更新日志

查看我们产品的最新动态

人声分离器 — 去除背景噪音

2.5.0

从任何音频文件中提取干净的人声。一键去除音乐、背景噪音和不需要的声音。

2026/03/20

更新内容

全新推出 Voice Isolator — 一款将人声与音频文件中其他一切声音分离的工具。

上传一段包含背景音乐、街道噪音或回声的录音，Voice Isolator 会提取出干净的人声轨道。一键操作，无需手动编辑。

使用方法

在侧边栏中点击 Voice Isolator
上传你的音频文件（MP3、WAV、OGG、AAC、FLAC — 最大 500MB）
AI 处理音频并分离人声与背景
预览分离后的人声
下载干净的音频文件

应用场景

清理播客录音 — 去除录制中意外混入的空调嗡嗡声、键盘敲击声或街道噪音
从音乐中提取人声 — 将歌声从伴奏中分离出来
改善视频配音 — 去除手机录音中的噪音，将干净音频用于视频
为声音克隆准备素材 — 在创建声音克隆之前，从嘈杂的录音中获取干净的样本
混音和二次创作 — 提取清唱人声用于创意项目

前后对比播放器

结果页面展示并排对比。在原始音频和分离后的音频之间切换，清楚地听到变化。两个版本都可以下载。

支持的格式

格式	最大文件大小	最长时长
MP3, WAV, OGG, AAC, FLAC	500 MB	1 小时

定价

Voice Isolator 根据音频时长消耗积分。所有已登录用户均可使用。

在侧边栏中找到 Voice Isolator 即可开始使用。

AI 播客生成器

2.3.0

将任何主题转化为多人对话的播客节目。选择声音、自定义脚本，下载录音棚级别的音频。

2026/03/10

更新内容

你现在可以直接在 AnySpeech 中用 AI 生成完整的播客节目。

给出一个主题（或粘贴你自己的脚本），选择两个声音，系统就会生成一段自然流畅的对话，包含来回的交流。

使用方法

输入一个主题或粘贴脚本
为主持人选择两个 AI 声音
审阅并编辑生成的脚本
生成完整的音频节目
下载制作好的播客

AI 会撰写对话、处理说话者切换，并将所有内容生成为一个可下载的音频文件。

独特之处

真实的对话流 — 不只是两个声音交替朗读。AI 会生成自然的过渡、反应和追问。
脚本编辑 — 在生成音频前审阅和调整脚本。删除段落、添加你自己的台词，或重新组织对话结构。
丰富的声音选择 — 从我们 200+ 个声音中任意选择。混搭不同语言，制作多语言节目。
录音棚级音质 — 输出使用我们的 Advanced 语音引擎，达到广播级音频质量。

应用场景

内容再利用 — 将博客文章或文章转化为可收听的播客
教育内容 — 以访谈形式创建任何主题的课程
市场营销 — 无需邀请嘉宾即可制作思想领袖播客
原型设计 — 在投入完整制作之前先草拟播客节目

使用方式

所有拥有 AnySpeech 账号的用户均可使用。播客生成使用你套餐中的积分（与 Advanced 语音费率相同）。

在侧边栏中找到 AI Podcast Generator 即可开始使用。

语音转文字功能上线

2.4.0

将音频和视频文件转换为精确的文字转录。上传文件，几分钟内获得完整的文字稿。

2026/03/01

更新内容

AnySpeech 现在可以反向工作了。上传任何音频或视频文件，获得精确的文字转录。

我们从第一天起就是一个文字转语音平台。现在我们也支持语音转文字 — 让 AnySpeech 成为一个完整的音频-文字工具箱。

使用方法

在侧边栏中点击 Speech to Text
上传音频文件（MP3、WAV、M4A）或视频文件
AI 对内容进行转录
审阅、编辑并下载你的文字稿

核心功能

高准确度 — 由最先进的语音识别技术驱动
多语言支持 — 支持数十种语言的音频转录
说话人识别 — 自动识别对话中的不同说话者
时间戳 — 每个片段都包含时间信息
实时进度 — 通过 SSE 流式传输实时查看转录过程

应用场景

转录会议和访谈 — 将录音变为可搜索的文字
制作字幕 — 用转录稿作为视频字幕的起点
内容再利用 — 将播客节目转化为博客文章
无障碍访问 — 让听障人士也能获取音频内容
往返工作流 — 转录音频 → 编辑文字 → 用更好的 AI 声音重新生成

定价

语音转文字使用你套餐中的积分。费用基于音频时长。请在仪表板中查看实时积分使用情况。

所有已登录用户均可使用。

现已支持 10 种语言

2.2.0

AnySpeech 现已完整翻译为 10 种语言 — 英语、中文、西班牙语、葡萄牙语、法语、德语、土耳其语、日语、韩语和意大利语。

2026/02/15

更新内容

AnySpeech 现已支持 10 种语言。每个页面、每个按钮、每个设置菜单 — 全部完成翻译。

支持的语言

语言	代码	旗帜
English	en	🇺🇸
中文 (Chinese)	zh	🇨🇳
Español (Spanish)	es	🇪🇸
Português (Portuguese)	pt	🇧🇷
Français (French)	fr	🇫🇷
Deutsch (German)	de	🇩🇪
Türkçe (Turkish)	tr	🇹🇷
日本語 (Japanese)	ja	🇯🇵
한국어 (Korean)	ko	🇰🇷
Italiano (Italian)	it	🇮🇹

翻译范围

所有内容：

完整网站界面（工作台、仪表板、设置）
所有 SEO 内容和落地页
博客文章
法律页面（隐私政策、服务条款、Cookie 政策）
邮件模板
定价和套餐说明

如何切换

点击导航栏中的语言选择器。你的偏好会自动保存，并在各个会话中保持不变。

为什么这很重要

超过 60% 的互联网用户更喜欢使用母语浏览网页。通过支持 10 种语言，我们正在让 AI 文字转语音服务惠及全球数十亿人。

更多语言即将推出。欢迎告诉我们你希望看到哪种语言。

免费文字转语音页面

2.1.0

专属免费 TTS 工具 — 无需注册、无限制、无需信用卡。只需粘贴文字，即可生成 100+ 种语言的语音。

2026/02/01

更新内容

我们推出了一个专属免费文字转语音页面，地址为 /free-text-to-speech。

无需账号，无需信用卡，没有每日限制套路。打开页面，输入文字，即可生成语音。

为什么要单独做一个免费页面？

主要的 Text to Speech 工作台使用的是我们的 Advanced 和 Pro 语音 — 这需要账号和积分。这对专业工作来说很棒，但并非所有人都需要高级音质。

免费页面使用我们的 Basic 语音引擎，专为以下场景设计：

快速一次性转换
学生和研究人员
在投入高级音频之前测试脚本
任何只想无障碍使用免费 TTS 的人

你将获得

100+ 种语言支持
无需注册 — 即开即用
每次生成都可下载 MP3
音频无水印
允许商业用途

字符限制

用户类型	每次请求字符数
未登录	1,000
已登录（免费）	5,000
付费套餐	按套餐默认值

升级路径

想要更好的语音质量？免费页面包含 Basic 和 Advanced 语音的对比，你可以听到差异，并在准备好时进行升级。

AI 声音克隆功能上线

2.0.0

仅需 10 秒音频即可克隆任何声音 — 支持情感控制。为你的所有内容打造统一的品牌声音。

2026/01/15

更新内容

这是一次重大更新。你现在可以仅用一段 10 秒的音频样本来克隆任何声音。

上传一段你自己（或任何你有权使用的声音）的短音频，AnySpeech 就会创建一个数字复制品，你可以用它来生成无限量的语音。

使用方法

在侧边栏中点击 Voice Cloning
上传音频文件（MP3、WAV 或 M4A）— 10 到 30 秒最佳
为你的声音命名并确认授权
开始使用克隆声音生成语音

就这么简单。无需训练时间，无需等待数小时。声音立即可用。

情感控制

这是我们声音克隆的独特之处。每个克隆声音都支持可调节的情感：

开心
平静
兴奋
悲伤
愤怒
中性

你可以为每次生成选择不同的情感。同一个声音，不同的表达方式 — 完美匹配每段内容的情绪。

夸张程度滑块

控制情感的戏剧化程度。喜剧短剧可以调高，专业旁白则保持微妙。

各套餐配额

套餐	可创建克隆声音数
Free	1
Basic	3
Standard	5
Professional	10
Premium	20
Max	50

定价

声音克隆使用与 Advanced 语音相同的积分费率（1x）。克隆功能本身不额外收费。

免费用户可以获得一个声音克隆体验名额。升级套餐以创建更多克隆声音。

全新声音选择体验

1.3.0

我们全面重新设计了声音选择界面，支持预览播放和最近使用的声音。

2025/12/15

新功能

我们全面重新设计了声音选择体验，让您更轻松、更快速地找到适合您内容的完美声音。

声音预览

现在您可以直接在声音列表中预览任何声音。只需点击声音旁边的播放按钮，即可在选择前试听示例。

最近使用的声音

声音选择器顶部新增了**"最近使用"**区域，让您快速访问之前使用过的声音。再也不用在整个列表中滚动查找了！

搜索和筛选

按名称搜索声音
按语言筛选
声音现在按语言分组，浏览更方便

改进的声音卡片

每个声音卡片现在显示：

声音名称和语言
预览播放按钮
清晰的选中状态指示

此更新让您更快地找到和切换声音，特别是当您需要使用多种语言时。

基础版声音现已支持 60+ 种语言

1.2.0

免费的基础版声音模型现已支持超过 60 种语言，包括粤语、日语、韩语等。

2025/12/10

新功能

基础版声音模型现已支持超过 60 种语言，让全球用户都能使用专业的文字转语音服务。

新增语言

以下是基础版声音新增支持的部分语言：

亚洲语言：

粤语
日语
韩语
越南语
泰语
印尼语

欧洲语言：

法语
德语
西班牙语
意大利语
葡萄牙语
荷兰语
波兰语
俄语

更多语言：

阿拉伯语
印地语
土耳其语
希腊语
希伯来语
以及 40+ 种其他语言

如何使用

从模型选择器中选择"基础版"
选择您需要的语言声音
输入文本并生成

所有基础版声音语言都免费使用 - 不消耗任何积分！

基础版声音现已免费

1.1.0

基础版声音模型现已完全免费使用 - 无需消耗积分。

2025/12/05

新功能

我们让 AI 文字转语音更加便捷！基础版声音现已对所有用户完全免费。

免费使用限制

用户类型	每日请求次数	单次最大字符数
未登录用户	10 次	1,000 字符
免费账户	20 次	5,000 字符
付费账户	无限制	无限制

为什么做此改变

我们相信每个人都应该能够无门槛地尝试 AI 文字转语音。基础版声音非常适合：

快速演示和测试
短文本内容
学习和实验
多语言内容创作

无需积分

与高级版和专业版声音不同，基础版声音不消耗任何积分。在每日限制内随意使用！

想要更多？

如果您需要更高质量的声音或无限使用基础版：

高级版声音：优质音质，每字符消耗 1 积分
专业版声音：录音室级品质，每字符消耗 2 积分
付费计划：无限使用基础版声音，无每日限制

立即尝试基础版声音，体验 AI 文字转语音能为您的内容带来什么！

更快的音频生成

1.0.0

音频生成速度提升最高 50%，并支持实时进度跟踪。

2025/12/01

新功能

我们大幅改进了音频生成基础设施，实现了更快的生成速度和更好的用户体验。

速度提升

平均生成时间加快 50%
长文本处理更加稳定
更好地处理多个并发请求

实时进度

现在您可以准确看到音频生成的进度：

实时进度条显示完成百分比
音频创建过程中的状态更新
生成完成时的清晰提示

长文本支持

对于较长的内容，我们现在更智能地处理文本：

自动分块以获得最佳处理效果
无缝音频合并
整个输出保持一致的质量

这对您意味着什么

更少的等待时间
更好地了解生成进度
更可靠的结果，特别是对于较长的内容

这些改进适用于所有声音模型（基础版、高级版和专业版）。