Ubuntu Myna：动口不动手，语音输入新体验

Mark Do 2026年7月1日评论已关闭阅读 1,220 次

Ubuntu Myna 项目：让语音替代键盘

今年，Ubuntu 将引入一系列 AI 功能，创始人 Mark Shuttleworth 期望这一发行版成为“智能体”（agentic）时代的操作系统。宏伟的愿景始于微小的种子——首个落地的功能便是一个名为 Myna 的语音转文字工具。

Myna 是什么？

名称：Myna（源自善于模仿人语的八哥鸟）。
问世时间：将于 2026 年 10 月发布的 Ubuntu 26.10 中首次亮相，距今约 4 个月。
外观：没有图形界面，仅作为一个键盘快捷键存在——按下热键即可对着电脑说话，文字自动出现在屏幕上。
核心功能：一款“轻量级 AI 语音转文字应用”。只要是可以输入文本的地方，你就能用语音替代打字。Canonical 工程副总裁 Jon Seager 在 Ubuntu 峰会上表示：“既然能直接对智能体说话，何必像动物一样打字？”

为什么放弃打字？

Seager 的幽默反问点出了痛点：对于习惯于高效输入的用户而言，语音输入能大幅提升速度。不过，在密码字段中无法使用语音（安全性考虑），且涂鸦式的口齿不清可能导致转录错误——但这也正是你需要手指来回退的时候。

与常被误解的 AI 助手不同，Myna 并非融入 GNOME 面板的聊天机器人，也不是窥探系统权限的“副驾驶”。它仅仅是基于语音识别模型的听写工具。Linux 平台长期以来缺乏优秀的听写解决方案，Canonical 此次有望真正填补这一空白。

隐私问题：我的声音会被盗用吗？

完全不必担心。Myna 采用本地开源的语音模型，所有处理都在你的设备上完成。麦克风仅在按下热键时唤醒，音频数据在内存中处理后立即丢弃，绝不上传至云端。这是 Canonical 的设计原则。

现在能试用吗？

还不行。目前 Myna 的 GitHub 仓库中仅包含架构文档和流程图（因此开头我用“种子”比喻）。其工作流程为：沙盒化的 Inference Snap 负责音频处理，而 Myna 本身作为“语音编排器”管理何时何地触发转录。不过 Canonical 已在向现有听写工具用户收集反馈，以便打磨细节。

语言支持：非英语用户能用吗？

Myna 的语言覆盖范围取决于所接入的模型。Canonical 正在评估 Whisper、Nvidia Nemotron、Parakeet 以及 Qwen3-ASR，其中部分模型支持多语言。具体支持哪些语言，10 月见分晓。

它不是语音助手，对吗？

正确。Myna 明确不是语音助手：不支持唤醒词、连续监听、桌面控制或语音命令。Canonical 表示先聚焦基础功能，将其做扎实再说。不过未来不排除扩展。

我能关掉它吗？

可以。AI 相关功能将采用独立 Snap 包分发，不会被强制捆绑进系统安装器。如果你对 AI 感到厌倦或抵制，只需在终端输入 sudo snap remove all-the-ai 即可全局卸载。

结语：值得期待吗？

对普通用户而言，语音听写可能只是“伪生产力”场景（比如 VC 大佬在公园长椅上念商业计划书），但真正的价值在于无障碍体验——让行动不便或打字困难的人群能够高效使用系统。如果 AI 浪潮能切实改善 Linux 上的听写体验，无疑是好事。

可以说：“Linux 终于有了好用的听写工具。”

不可以说：“嘿 Myna，今天天气怎么样？播放 mgk！重新订购厕纸！”——它做不到这些。

关注微信号：智享开源 ，及时了解更新信息。

原文链接：https://www.omgubuntu.co.uk/2026/06/what-is-myna-ubuntu-ai-dictation

微信捐赠	支付宝捐赠