NewMac OS 菜单栏语音输入

按下快捷键,语音输入转录为文本

Voxt 把转录、翻译、转写和应用增强都整合进同一套快捷键驱动的桌面流程中。ASR 与 LLM 分离后,你可以让采集走 MLX Audio、Whisper 或托管语音服务,而把转写、增强与翻译交给真正适合任务的模型栈。

EMLNJC

313+ Mac 用户正在使用

Voxt 桌面首页预览
VoxtFN
14:12100%

fn

标准转录

fn + shift

翻译转录或文本

fn + control

用语音指令转写

功能

四种工作流,让表达适应不同场景需求

Voxt 围绕语言转文本的结果可实现,文本格式增强,翻译,AI 助手交互

标准转录

01

说完即贴,把干净文本直接送进当前应用。

默认的 `fn` 流程会在你说话时持续显示实时转录,结束后再补全标点、清理口头语、应用针对不同应用的提示规则和个人词典,然后再输出。

快捷键

fn

fn

App Branch 可以按应用或 URL 切换不同提示规则。

个人词典可以稳定保留姓名与专有名词。

Slack 回复

简短对话润色

邮件草稿

邮件标点规则

Cursor 注释

更适合代码场景的表达

中英混合输入

多语言输入路径

音频一到就更新实时预览,不用等整段结束。

App Branch 可以按应用或 URL 切换增强规则,从聊天到邮件再到编程都能分别处理。

个人词典和混合语言处理可以稳定保留姓名、产品名和多语言短语。

翻译

02

不打断当前专注状态,直接翻译语音或选中文本。

`fn+shift` 流程既可以在语音转录后立刻翻译,也可以直接翻译高亮选中的文本,并且翻译链路可以单独选择模型与术语规则。

快捷键

fn + shift

语音 -> 翻译 -> 粘贴

快捷键流程

fn+shift

翻译选中文本

直接处理选中内容

选中

术语规则

自定义提示规则

术语
翻译

目标语言

独立模型

术语约束

回退策略

语音翻译沿用同一套采集层,不需要额外弹窗。

如果只想处理当前句子或段落,选中文本后就能直接触发翻译。

翻译提示词、目标语言和术语规则都可以独立配置,不受普通转录设置影响。

转写与提示

03

让语音不仅是输入,也能直接驱动文本转写。

`fn+control` 会把你的语音变成转写、改写或生成指令。你可以用语音调整选中文本、生成全新内容,或者在没有聚焦输入框时保留结果卡片。

快捷键

fn + control

指令

帮我写一段 200 字左右的自我介绍。

重写

把这段内容改得更短、更顺。

选中内容

重写当前高亮选中的文本。

结果卡片

即使不在可编辑输入框中,也能保留结果。

fn+control

语音指令

把这段内容改得更克制、更简洁,更适合发邮件同步进展。

选中文本

直接重写当前草稿,不需要切到别的应用。

生成结果

说出新的指令后,直接生成新的内容。

结果卡片

没有聚焦输入框时,输出结果也能持续可见。

模型通道

按任务选择最合适的翻译或重写模型。

直接自然地说出你的要求,再由 Voxt 把它转换成结构化提示词。

可以用“更短一点”“更顺一点”“更直接”“更正式”这类指令转写当前草稿。

可选的结果卡片让输出在非可编辑区域中也能继续保留。

应用增强

04

同一句话,在不同应用里自动变成合适的输出。

App Branch 会根据当前应用或 URL 套用不同的提示词、格式规则和词典增强,让聊天、邮件、文档和编辑器都能沿用同一套语音入口,但拿到不同风格的文本。

快捷键

App Branch

App Branch

Slack

输出更短、更口语,适合即时回复。

Mail

自动补齐句子和礼貌表达,适合正式沟通。

Docs

保留段落结构,适合整理笔记和草稿。

Editor

尽量保留技术术语、符号和代码上下文。

提示规则

按当前应用自动切换语气、长度和输出格式。

词典增强

在不同工作场景里保留专有名词、产品名和缩写。

输出风格

让同一段语音在不同应用里直接变成更合适的文本。

可以按 App 或 URL 切换增强规则,不需要为每种场景重新训练输入习惯。

同一段语音在 Slack 里可以更短,在邮件里可以更完整,在编辑器里可以保留更多技术符号。

应用增强会沿用当前的转录与模型路由,不额外增加一套独立工作流。

模型

模型选择,始终贴着任务本身。

Voxt 有意把 ASR 与 LLM 路由分开。语音转文字、翻译、转写和应用增强,都能各自使用最合适的模型通道。

模型架构

ASR 提供方与 LLM 提供方,从设计上就是分开的。

这种拆分在实际使用中很关键。语音路径可以走 MLX Audio、Whisper 或远程 ASR,而翻译和重写则可以切到本地 LLM、Apple 系统模型或托管服务,不必围绕单一厂商重建整套流程。

本地 ASR

MLX Audio、Whisper、系统听写

本地 LLM

Qwen、GLM、Llama、Mistral、Gemma

远程 ASR

OpenAI、Doubao、GLM ASR、Aliyun Bailian

远程 LLM

Anthropic、Gemini、OpenAI、Ollama 等

Voxt 模型配置预览

本地 ASR

优先选择运行在设备上的语音引擎。

Voxt 将语音识别视为独立通道。MLX Audio、通过 WhisperKit 运行的 Whisper,以及 Apple 系统听写,分别适合不同的启动成本、延迟和多语言需求。

MLX Audio 可覆盖 Qwen3-ASR、Voxtral Realtime、Cohere Transcribe、Parakeet、SenseVoice 等模型。

Whisper 作为独立通道存在,拥有自己的下载、运行控制,以及可选的转英文流程。

如果你不想先下载模型,系统听写是上手门槛最低的路径。

本地 LLM

在需要时,把增强和转写都留在 Mac 本地完成。

当你更在意隐私或离线可控性时,本地 LLM 可以承担清理、翻译、格式整理和转写。内置模型目录覆盖了从轻量到更强、适配 Apple Silicon 的多种选择。

Qwen、GLM、Llama、Mistral 和 Gemma 系列都可以作为可下载的本地模型使用。

你可以把重推理任务留给远程模型,而把日常清理留在本地完成。

本地通道尤其适合标点补全、简洁转写和可重复执行的提示词工作流。

远程 ASR

不改变工作流,也能自由切换转录服务商。

远程 ASR 与 LLM 分开配置,因此转录可以优先追求低延迟,而转写、增强与翻译则使用另一套服务商组合。

支持 OpenAI、Doubao ASR、GLM ASR 和阿里云百炼 ASR 等独立服务路径。

当你需要针对实时输入、长句转录或混合语言场景做取舍时,可以按任务切换不同服务商。

这更适合优化中英混说、实时表现,或兼容特定托管服务。

远程 LLM

把重写和翻译路由到最适合当前任务的模型提供方。

Voxt 对远程 LLM 的支持范围很广。无论是原生服务商、兼容 OpenAI 的接口,还是自托管通道,都能在不打断工作流的前提下接入。

支持 Anthropic Claude、Google Gemini、OpenAI GPT、Ollama、DeepSeek、OpenRouter、xAI Grok、Z.ai GLM、火山引擎 Doubao、Kimi、LM Studio、MiniMax 和阿里云百炼 Qwen。

翻译可以独立选择自己的模型提供方,而不是继承默认重写设置。

当你需要更长上下文、更强重写质量或特定厂商能力时,托管模型更合适。

多语言输入覆盖

说任何语言,都能进入
同一个工作流。

Voxt 面向中英混说、跨语言翻译和多地区团队协作优化,转录、翻译、转写和应用增强都可以共享同一套快捷键。

France
Germany
USA
China
Mexico
Japan
Brazil
Canada
UK
Colombia
UAE
95+ More

快速开始

5 分钟接入

1下载 Voxt
2连接模型
3开始输出
是的,完全免费。

不一定。你可以把 ASR 和 LLM 都切到本地通道,也可以只把转录留在本地、把重写或翻译交给远程模型。联网能力是可选路由,不是单一路径。

Ethan Luo

Ethan Luo

@ethanluo · 4月24日

真正让我离不开的是 App Branch。我可以在 Slack 用一套清理提示词,在邮件里用另一套,但都挂在同一个按住说话的快捷键后面。

193421418.4K
Nadia Ross

Nadia Ross

@nadiaross · 4月17日

最让我形成习惯的是翻译快捷键。选中文本,按下热键,拿到干净的双语改写,然后继续写下去。

9161419.6K
Yuki Tan

Yuki Tan

@yukitan · 4月10日

我把客服回复、产品笔记和英文邮件都拆成了不同的 App Branch。说完直接进当前窗口,语气也能跟着场景变。

162518413.2K
Mina Park

Mina Park

@minapark · 4月22日

应用增强是我最先持续使用的功能。同一句话进 Slack 会更短,进邮件会更完整,进文档又会保留结构。以前我要自己来回改语气,现在基本按住说完就能直接继续工作。

121816712.1K
Jonas Wei

Jonas Wei

@jonaswei · 4月15日

本地采集走 Whisper,清理走 Gemini,而且到处都是同一个快捷键。这种拆分方式才让它像真正的桌面工具,而不是演示品。尤其是在编辑器、邮件和 Linear 之间切换时,App Branch 会自动换输出风格,长句也不需要我再手动整理。

142217611.9K
Marcus Chen

Marcus Chen

@marcuschen · 4月8日

之前我只把语音输入当成听写,现在会把它当成一层工作流。先转录,再清理,再按应用输出,整个过程没有打断感。

182920616.4K
Leo Shen

Leo Shen

@leoshen · 4月20日

我很喜欢 ASR 和 LLM 分开配置。语音路径交给豆包,重写时再按任务切到 Claude 或本地 Qwen。

212719315.8K
Clara Boone

Clara Boone

@claraboone · 4月13日

Voxt 是少数真正尊重上下文的语音工具。选中文本翻译和重写流程,帮我省掉了整天在第二个应用里复制粘贴。

112015810.7K
Iris Morgan

Iris Morgan

@irismorgan · 4月6日

最实用的是可以按任务换模型。短文本用本地模型很快,正式回复再切远程 LLM,质量和速度都能自己掌控。

132117312.8K

把语音快捷键、模型选择和最终文本,
都放在同一个地方。

在 macOS 上安装 Voxt,选好适合你工作流的 ASR 与 LLM 通道,然后在不切换工具的前提下,从说话一路进入粘贴、翻译、转写或应用增强。