
今年,Ubuntu 将引入一系列 AI 功能,创始人 Mark Shuttleworth 期望这一发行版成为“智能体”(agentic)时代的操作系统。宏伟的愿景始于微小的种子——首个落地的功能便是一个名为 Myna 的语音转文字工具。
Seager 的幽默反问点出了痛点:对于习惯于高效输入的用户而言,语音输入能大幅提升速度。不过,在密码字段中无法使用语音(安全性考虑),且涂鸦式的口齿不清可能导致转录错误——但这也正是你需要手指来回退的时候。
与常被误解的 AI 助手不同,Myna 并非融入 GNOME 面板的聊天机器人,也不是窥探系统权限的“副驾驶”。它仅仅是基于语音识别模型的听写工具。Linux 平台长期以来缺乏优秀的听写解决方案,Canonical 此次有望真正填补这一空白。
完全不必担心。Myna 采用本地开源的语音模型,所有处理都在你的设备上完成。麦克风仅在按下热键时唤醒,音频数据在内存中处理后立即丢弃,绝不上传至云端。这是 Canonical 的设计原则。
还不行。目前 Myna 的 GitHub 仓库中仅包含架构文档和流程图(因此开头我用“种子”比喻)。其工作流程为:沙盒化的 Inference Snap 负责音频处理,而 Myna 本身作为“语音编排器”管理何时何地触发转录。不过 Canonical 已在向现有听写工具用户收集反馈,以便打磨细节。
Myna 的语言覆盖范围取决于所接入的模型。Canonical 正在评估 Whisper、Nvidia Nemotron、Parakeet 以及 Qwen3-ASR,其中部分模型支持多语言。具体支持哪些语言,10 月见分晓。
正确。Myna 明确不是语音助手:不支持唤醒词、连续监听、桌面控制或语音命令。Canonical 表示先聚焦基础功能,将其做扎实再说。不过未来不排除扩展。
可以。AI 相关功能将采用独立 Snap 包分发,不会被强制捆绑进系统安装器。如果你对 AI 感到厌倦或抵制,只需在终端输入 sudo snap remove all-the-ai 即可全局卸载。
对普通用户而言,语音听写可能只是“伪生产力”场景(比如 VC 大佬在公园长椅上念商业计划书),但真正的价值在于无障碍体验——让行动不便或打字困难的人群能够高效使用系统。如果 AI 浪潮能切实改善 Linux 上的听写体验,无疑是好事。
可以说:“Linux 终于有了好用的听写工具。”
不可以说:“嘿 Myna,今天天气怎么样?播放 mgk!重新订购厕纸!”——它做不到这些。
关注微信号:智享开源 ,及时了解更新信息。
原文链接:https://www.omgubuntu.co.uk/2026/06/what-is-myna-ubuntu-ai-dictation
你必须 登录 才能发表评论.
| 微信捐赠 | 支付宝捐赠 |
|---|---|
![]() |
![]() |
扫码关注公众号:智享开源

还没有任何评论,你来说两句吧!