Ubuntu Myna:动口不动手,语音输入新体验

Ubuntu Myna 项目:让语音替代键盘

今年,Ubuntu 将引入一系列 AI 功能,创始人 Mark Shuttleworth 期望这一发行版成为“智能体”(agentic)时代的操作系统。宏伟的愿景始于微小的种子——首个落地的功能便是一个名为 Myna 的语音转文字工具。

Myna 是什么?

  • 名称:Myna(源自善于模仿人语的八哥鸟)。
  • 问世时间:将于 2026 年 10 月发布的 Ubuntu 26.10 中首次亮相,距今约 4 个月。
  • 外观:没有图形界面,仅作为一个键盘快捷键存在——按下热键即可对着电脑说话,文字自动出现在屏幕上。
  • 核心功能:一款“轻量级 AI 语音转文字应用”。只要是可以输入文本的地方,你就能用语音替代打字。Canonical 工程副总裁 Jon Seager 在 Ubuntu 峰会上表示:“既然能直接对智能体说话,何必像动物一样打字?”

为什么放弃打字?

Seager 的幽默反问点出了痛点:对于习惯于高效输入的用户而言,语音输入能大幅提升速度。不过,在密码字段中无法使用语音(安全性考虑),且涂鸦式的口齿不清可能导致转录错误——但这也正是你需要手指来回退的时候。

与常被误解的 AI 助手不同,Myna 并非融入 GNOME 面板的聊天机器人,也不是窥探系统权限的“副驾驶”。它仅仅是基于语音识别模型的听写工具。Linux 平台长期以来缺乏优秀的听写解决方案,Canonical 此次有望真正填补这一空白。

隐私问题:我的声音会被盗用吗?

完全不必担心。Myna 采用本地开源的语音模型,所有处理都在你的设备上完成。麦克风仅在按下热键时唤醒,音频数据在内存中处理后立即丢弃,绝不上传至云端。这是 Canonical 的设计原则。

现在能试用吗?

还不行。目前 Myna 的 GitHub 仓库中仅包含架构文档和流程图(因此开头我用“种子”比喻)。其工作流程为:沙盒化的 Inference Snap 负责音频处理,而 Myna 本身作为“语音编排器”管理何时何地触发转录。不过 Canonical 已在向现有听写工具用户收集反馈,以便打磨细节。

语言支持:非英语用户能用吗?

Myna 的语言覆盖范围取决于所接入的模型。Canonical 正在评估 Whisper、Nvidia NemotronParakeet 以及 Qwen3-ASR,其中部分模型支持多语言。具体支持哪些语言,10 月见分晓。

它不是语音助手,对吗?

正确。Myna 明确不是语音助手:不支持唤醒词、连续监听、桌面控制或语音命令。Canonical 表示先聚焦基础功能,将其做扎实再说。不过未来不排除扩展。

我能关掉它吗?

可以。AI 相关功能将采用独立 Snap 包分发,不会被强制捆绑进系统安装器。如果你对 AI 感到厌倦或抵制,只需在终端输入 sudo snap remove all-the-ai 即可全局卸载。

结语:值得期待吗?

对普通用户而言,语音听写可能只是“伪生产力”场景(比如 VC 大佬在公园长椅上念商业计划书),但真正的价值在于无障碍体验——让行动不便或打字困难的人群能够高效使用系统。如果 AI 浪潮能切实改善 Linux 上的听写体验,无疑是好事。

可以说:“Linux 终于有了好用的听写工具。”

不可以说:“嘿 Myna,今天天气怎么样?播放 mgk!重新订购厕纸!”——它做不到这些。


关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://www.omgubuntu.co.uk/2026/06/what-is-myna-ubuntu-ai-dictation

评论列表

发表评论

你必须 登录 才能发表评论.

为您推荐


请支持IMCN发展!

谁在捐赠

微信捐赠 支付宝捐赠
微信捐赠 支付宝捐赠
ta的个人站点

发表文章4408篇

关注我的头条 不要放弃,百折不挠,坚强、自信。


扫码关注公众号:智享开源

最新科技信息


归档

近期评论