更新日志

查看我们产品的最新动态

人声分离器 — 去除背景噪音

2.5.0

从任何音频文件中提取干净的人声。一键去除音乐、背景噪音和不需要的声音。

2026/03/20

更新内容

全新推出 Voice Isolator — 一款将人声与音频文件中其他一切声音分离的工具。

上传一段包含背景音乐、街道噪音或回声的录音,Voice Isolator 会提取出干净的人声轨道。一键操作,无需手动编辑。

使用方法

  1. 在侧边栏中点击 Voice Isolator
  2. 上传你的音频文件(MP3、WAV、OGG、AAC、FLAC — 最大 500MB)
  3. AI 处理音频并分离人声与背景
  4. 预览分离后的人声
  5. 下载干净的音频文件

应用场景

  • 清理播客录音 — 去除录制中意外混入的空调嗡嗡声、键盘敲击声或街道噪音
  • 从音乐中提取人声 — 将歌声从伴奏中分离出来
  • 改善视频配音 — 去除手机录音中的噪音,将干净音频用于视频
  • 为声音克隆准备素材 — 在创建声音克隆之前,从嘈杂的录音中获取干净的样本
  • 混音和二次创作 — 提取清唱人声用于创意项目

前后对比播放器

结果页面展示并排对比。在原始音频和分离后的音频之间切换,清楚地听到变化。两个版本都可以下载。

支持的格式

格式最大文件大小最长时长
MP3, WAV, OGG, AAC, FLAC500 MB1 小时

定价

Voice Isolator 根据音频时长消耗积分。所有已登录用户均可使用。

在侧边栏中找到 Voice Isolator 即可开始使用。

AI 播客生成器

2.3.0

将任何主题转化为多人对话的播客节目。选择声音、自定义脚本,下载录音棚级别的音频。

2026/03/10

更新内容

你现在可以直接在 AnySpeech 中用 AI 生成完整的播客节目

给出一个主题(或粘贴你自己的脚本),选择两个声音,系统就会生成一段自然流畅的对话,包含来回的交流。

使用方法

  1. 输入一个主题或粘贴脚本
  2. 为主持人选择两个 AI 声音
  3. 审阅并编辑生成的脚本
  4. 生成完整的音频节目
  5. 下载制作好的播客

AI 会撰写对话、处理说话者切换,并将所有内容生成为一个可下载的音频文件。

独特之处

  • 真实的对话流 — 不只是两个声音交替朗读。AI 会生成自然的过渡、反应和追问。
  • 脚本编辑 — 在生成音频前审阅和调整脚本。删除段落、添加你自己的台词,或重新组织对话结构。
  • 丰富的声音选择 — 从我们 200+ 个声音中任意选择。混搭不同语言,制作多语言节目。
  • 录音棚级音质 — 输出使用我们的 Advanced 语音引擎,达到广播级音频质量。

应用场景

  • 内容再利用 — 将博客文章或文章转化为可收听的播客
  • 教育内容 — 以访谈形式创建任何主题的课程
  • 市场营销 — 无需邀请嘉宾即可制作思想领袖播客
  • 原型设计 — 在投入完整制作之前先草拟播客节目

使用方式

所有拥有 AnySpeech 账号的用户均可使用。播客生成使用你套餐中的积分(与 Advanced 语音费率相同)。

在侧边栏中找到 AI Podcast Generator 即可开始使用。

语音转文字功能上线

2.4.0

将音频和视频文件转换为精确的文字转录。上传文件,几分钟内获得完整的文字稿。

2026/03/01

更新内容

AnySpeech 现在可以反向工作了。上传任何音频或视频文件,获得精确的文字转录。

我们从第一天起就是一个文字转语音平台。现在我们也支持语音转文字 — 让 AnySpeech 成为一个完整的音频-文字工具箱。

使用方法

  1. 在侧边栏中点击 Speech to Text
  2. 上传音频文件(MP3、WAV、M4A)或视频文件
  3. AI 对内容进行转录
  4. 审阅、编辑并下载你的文字稿

核心功能

  • 高准确度 — 由最先进的语音识别技术驱动
  • 多语言支持 — 支持数十种语言的音频转录
  • 说话人识别 — 自动识别对话中的不同说话者
  • 时间戳 — 每个片段都包含时间信息
  • 实时进度 — 通过 SSE 流式传输实时查看转录过程

应用场景

  • 转录会议和访谈 — 将录音变为可搜索的文字
  • 制作字幕 — 用转录稿作为视频字幕的起点
  • 内容再利用 — 将播客节目转化为博客文章
  • 无障碍访问 — 让听障人士也能获取音频内容
  • 往返工作流 — 转录音频 → 编辑文字 → 用更好的 AI 声音重新生成

定价

语音转文字使用你套餐中的积分。费用基于音频时长。请在仪表板中查看实时积分使用情况。

所有已登录用户均可使用。

现已支持 10 种语言

2.2.0

AnySpeech 现已完整翻译为 10 种语言 — 英语、中文、西班牙语、葡萄牙语、法语、德语、土耳其语、日语、韩语和意大利语。

2026/02/15

更新内容

AnySpeech 现已支持 10 种语言。每个页面、每个按钮、每个设置菜单 — 全部完成翻译。

支持的语言

语言代码旗帜
Englishen🇺🇸
中文 (Chinese)zh🇨🇳
Español (Spanish)es🇪🇸
Português (Portuguese)pt🇧🇷
Français (French)fr🇫🇷
Deutsch (German)de🇩🇪
Türkçe (Turkish)tr🇹🇷
日本語 (Japanese)ja🇯🇵
한국어 (Korean)ko🇰🇷
Italiano (Italian)it🇮🇹

翻译范围

所有内容:

  • 完整网站界面(工作台、仪表板、设置)
  • 所有 SEO 内容和落地页
  • 博客文章
  • 法律页面(隐私政策、服务条款、Cookie 政策)
  • 邮件模板
  • 定价和套餐说明

如何切换

点击导航栏中的语言选择器。你的偏好会自动保存,并在各个会话中保持不变。

为什么这很重要

超过 60% 的互联网用户更喜欢使用母语浏览网页。通过支持 10 种语言,我们正在让 AI 文字转语音服务惠及全球数十亿人。

更多语言即将推出。欢迎告诉我们你希望看到哪种语言。

免费文字转语音页面

2.1.0

专属免费 TTS 工具 — 无需注册、无限制、无需信用卡。只需粘贴文字,即可生成 100+ 种语言的语音。

2026/02/01

更新内容

我们推出了一个专属免费文字转语音页面,地址为 /free-text-to-speech

无需账号,无需信用卡,没有每日限制套路。打开页面,输入文字,即可生成语音。

为什么要单独做一个免费页面?

主要的 Text to Speech 工作台使用的是我们的 Advanced 和 Pro 语音 — 这需要账号和积分。这对专业工作来说很棒,但并非所有人都需要高级音质。

免费页面使用我们的 Basic 语音引擎,专为以下场景设计:

  • 快速一次性转换
  • 学生和研究人员
  • 在投入高级音频之前测试脚本
  • 任何只想无障碍使用免费 TTS 的人

你将获得

  • 100+ 种语言支持
  • 无需注册 — 即开即用
  • 每次生成都可下载 MP3
  • 音频无水印
  • 允许商业用途

字符限制

用户类型每次请求字符数
未登录1,000
已登录(免费)5,000
付费套餐按套餐默认值

升级路径

想要更好的语音质量?免费页面包含 Basic 和 Advanced 语音的对比,你可以听到差异,并在准备好时进行升级。

AI 声音克隆功能上线

2.0.0

仅需 10 秒音频即可克隆任何声音 — 支持情感控制。为你的所有内容打造统一的品牌声音。

2026/01/15

更新内容

这是一次重大更新。你现在可以仅用一段 10 秒的音频样本来克隆任何声音

上传一段你自己(或任何你有权使用的声音)的短音频,AnySpeech 就会创建一个数字复制品,你可以用它来生成无限量的语音。

使用方法

  1. 在侧边栏中点击 Voice Cloning
  2. 上传音频文件(MP3、WAV 或 M4A)— 10 到 30 秒最佳
  3. 为你的声音命名并确认授权
  4. 开始使用克隆声音生成语音

就这么简单。无需训练时间,无需等待数小时。声音立即可用。

情感控制

这是我们声音克隆的独特之处。每个克隆声音都支持可调节的情感

  • 开心
  • 平静
  • 兴奋
  • 悲伤
  • 愤怒
  • 中性

你可以为每次生成选择不同的情感。同一个声音,不同的表达方式 — 完美匹配每段内容的情绪。

夸张程度滑块

控制情感的戏剧化程度。喜剧短剧可以调高,专业旁白则保持微妙。

各套餐配额

套餐可创建克隆声音数
Free1
Basic3
Standard5
Professional10
Premium20
Max50

定价

声音克隆使用与 Advanced 语音相同的积分费率(1x)。克隆功能本身不额外收费。

免费用户可以获得一个声音克隆体验名额。升级套餐以创建更多克隆声音。

全新声音选择体验

1.3.0

我们全面重新设计了声音选择界面,支持预览播放和最近使用的声音。

2025/12/15

新功能

我们全面重新设计了声音选择体验,让您更轻松、更快速地找到适合您内容的完美声音。

声音预览

现在您可以直接在声音列表中预览任何声音。只需点击声音旁边的播放按钮,即可在选择前试听示例。

最近使用的声音

声音选择器顶部新增了**"最近使用"**区域,让您快速访问之前使用过的声音。再也不用在整个列表中滚动查找了!

搜索和筛选

  • 按名称搜索声音
  • 按语言筛选
  • 声音现在按语言分组,浏览更方便

改进的声音卡片

每个声音卡片现在显示:

  • 声音名称和语言
  • 预览播放按钮
  • 清晰的选中状态指示

此更新让您更快地找到和切换声音,特别是当您需要使用多种语言时。

基础版声音现已支持 60+ 种语言

1.2.0

免费的基础版声音模型现已支持超过 60 种语言,包括粤语、日语、韩语等。

2025/12/10

新功能

基础版声音模型现已支持超过 60 种语言,让全球用户都能使用专业的文字转语音服务。

新增语言

以下是基础版声音新增支持的部分语言:

亚洲语言:

  • 粤语
  • 日语
  • 韩语
  • 越南语
  • 泰语
  • 印尼语

欧洲语言:

  • 法语
  • 德语
  • 西班牙语
  • 意大利语
  • 葡萄牙语
  • 荷兰语
  • 波兰语
  • 俄语

更多语言:

  • 阿拉伯语
  • 印地语
  • 土耳其语
  • 希腊语
  • 希伯来语
  • 以及 40+ 种其他语言

如何使用

  1. 从模型选择器中选择"基础版"
  2. 选择您需要的语言声音
  3. 输入文本并生成

所有基础版声音语言都免费使用 - 不消耗任何积分!

基础版声音现已免费

1.1.0

基础版声音模型现已完全免费使用 - 无需消耗积分。

2025/12/05

新功能

我们让 AI 文字转语音更加便捷!基础版声音现已对所有用户完全免费

免费使用限制

用户类型每日请求次数单次最大字符数
未登录用户10 次1,000 字符
免费账户20 次5,000 字符
付费账户无限制无限制

为什么做此改变

我们相信每个人都应该能够无门槛地尝试 AI 文字转语音。基础版声音非常适合:

  • 快速演示和测试
  • 短文本内容
  • 学习和实验
  • 多语言内容创作

无需积分

与高级版和专业版声音不同,基础版声音不消耗任何积分。在每日限制内随意使用!

想要更多?

如果您需要更高质量的声音或无限使用基础版:

  • 高级版声音:优质音质,每字符消耗 1 积分
  • 专业版声音:录音室级品质,每字符消耗 2 积分
  • 付费计划:无限使用基础版声音,无每日限制

立即尝试基础版声音,体验 AI 文字转语音能为您的内容带来什么!

更快的音频生成

1.0.0

音频生成速度提升最高 50%,并支持实时进度跟踪。

2025/12/01

新功能

我们大幅改进了音频生成基础设施,实现了更快的生成速度和更好的用户体验。

速度提升

  • 平均生成时间加快 50%
  • 长文本处理更加稳定
  • 更好地处理多个并发请求

实时进度

现在您可以准确看到音频生成的进度:

  • 实时进度条显示完成百分比
  • 音频创建过程中的状态更新
  • 生成完成时的清晰提示

长文本支持

对于较长的内容,我们现在更智能地处理文本:

  • 自动分块以获得最佳处理效果
  • 无缝音频合并
  • 整个输出保持一致的质量

这对您意味着什么

  • 更少的等待时间
  • 更好地了解生成进度
  • 更可靠的结果,特别是对于较长的内容

这些改进适用于所有声音模型(基础版、高级版和专业版)。