
每瓦性能(Tokens per watt,简称TpW)——即每消耗一瓦特能源所能产生的有效AI工作量——已成为企业CEO、AI负责人及基础设施团队最为关注的指标。面对GPU集群的高昂成本,如何从投入中榨取最大价值,无疑是当务之急。
然而,在追求Token产出的过程中,我们必须清醒地认识到:硬件效率并非影响数据中心运营成本或生成有效、创收AI工作量的唯一因素。TpW固然关键,但同样需要重视的是“时间价值”以及人力生产力,而这些在很大程度上取决于软件层面。
我们正在将Ubuntu打造为高效AI的软件基石。本文将分享一些具体案例,阐述我们所说的“为AI优化Ubuntu”究竟意味着什么。借助Ubuntu 26.04 LTS,我们不仅帮助组织从硬件中获取更多价值,更让依赖和支持AI栈的团队的工作更轻松、更高效。
如何从硬件中榨取更多Token?主流观点聚焦于模型优化、GPU利用率、首Token时间及每秒Token数。然而,拥有能够最大化利用芯片性能的软件层同样不可或缺。
宿主操作系统在AI基础设施栈中扮演着核心角色——这里的“核心”不仅指其重要性,更意味着它位于栈的中央,是连接硬件与软件的桥梁。操作系统管理者底层计算资源,因此它决定了你能否充分利用GPU及其他AI加速器。
基于此,Canonical与芯片供应商(如NVIDIA、AMD、Intel、Arm、Qualcomm,以及RISC-V平台)展开合作,在主流架构上全面优化Ubuntu。这种优化确保最大比例的功耗用于AI工作负载,而非操作系统开销。
同时,我们与合作伙伴共同推进硬件认证。通过提供标准化、预集成的安全启动支持和固件交付,Canonical使企业无需为每一块新硬件进行定制化OS工程。企业可以更快地实现价值,并节省工程资源。
让我们继续探索加速“时间价值”和提升人力生产力的主题。即使在AI时代,Ubuntu依然是一款“以人为本”的Linux系统,其核心理念之一是尽可能减少用户在部署和运维AI基础设施时的摩擦。
为此,我们与NVIDIA和AMD合作,将关键AI解决方案集成并分发到Ubuntu中。从Ubuntu 26.04 LTS开始,用户只需一条命令即可安装NVIDIA CUDA、AMD ROCm及NVIDIA DOCA-OFED。
NVIDIA CUDA和AMD ROCm是用于图形处理器通用计算(GPGPU)的框架。它们是开发者能够利用NVIDIA和AMD GPU的庞大吞吐量来处理AI工作负载的关键软件层。
过去,安装这些框架需要多步骤流程,且依赖冲突和兼容性问题常常给经验不足的用户带来挑战。而在Ubuntu 26.04 LTS中,只需一条apt install命令即可完成安装。
新的分发模式可为团队节省数小时甚至数天的GPGPU框架搭建时间,让组织更快地从GPU中获取价值。Canonical还确保用户拥有平滑的升级路径,从而在更新时获得这些平台最新特性的益处。
关于Ubuntu上AMD ROCm的更多疑问?我们刚刚发布了一份深度解读。
对于拥有大规模AI工厂和HPC集群的企业来说,NVIDIA DOCA-OFED是首选的高性能网络栈之一。然而,传统上实现超低延迟和高吞吐量数据传输的代价是复杂的设置与维护。系统管理员必须通过外部安装器或复杂的手动编译来管理网络驱动,这可能导致操作系统更新时出现版本冲突或内核不匹配问题。
如今,NVIDIA DOCA-OFED能够无缝安装,其整个生命周期管理得以简化。除快速安装外,新的工作流程还解决了内核漂移、驱动不兼容以及内核或操作系统升级后CI中断等常见运维痛点。基础设施团队在节省资源的同时,可以交付速度与稳定性。
Canonical工程副总裁Jon Seager近期撰文探讨了Ubuntu中AI的未来。他在文末写道:“Ubuntu不会变成一款AI产品。”但我们的承诺是让Ubuntu成为AI的“赋能者”。无论是在芯片层面针对每种架构的深度优化,还是在用户层面简化的工具集采用与生命周期管理,Ubuntu都是支撑高效AI基础设施策略的软件层。它可以帮助你获得更高的每瓦性能,超越这一指标,它能帮助你更快实现价值,并降低整体栈的运营成本。
若想了解更多关于AI基础设施最佳实践以及Ubuntu如何融入你的AI战略,欢迎阅读《私有AI基础设施企业指南》。
关注微信号:智享开源,及时了解更新信息。
原文链接:https://ubuntu.com//blog/beyond-tokens-per-watt
你必须 登录 才能发表评论.
| 微信捐赠 | 支付宝捐赠 |
|---|---|
![]() |
![]() |
扫码关注公众号:智享开源

[blog_mailer_subscribe]
还没有任何评论,你来说两句吧!