
Ubuntu Core专为生产级设备设计,包括网络设备、工业网关、机器人、自助终端和边缘AI产品。实际部署时,通常会构建自定义的Ubuntu Core镜像,包含所需快照、配置、权限和更新策略。
虚拟机提供了一种快速探索系统的方式。开发者可以在笔记本上启动Ubuntu Core,安装应用快照,测试服务,了解各个组件如何协同工作,然后再投入专门的硬件或生产镜像。
Multipass工具让这一切变得简单。它内置对Ubuntu Core镜像的支持,只需一条命令即可启动虚拟机,非常适合实验、演示和本地开发。
我们将在Ubuntu Core上创建一个本地AI推理设备。核心思路是:Ubuntu Core提供安全、精简、类似设备化的操作系统,而AI工作负载则以快照形式交付。
本示例使用gemma4推理快照。
由于AI推理需要比最小化shell测试更多的资源,我们启动一台配备更多CPU、内存和磁盘的虚拟机:
multipass launch core26 -n aibox --cpus 4 --memory 10GB --disk 16GB
然后进入实例:
multipass shell aibox
Ubuntu Core实例首次启动后可能自动更新并重新启动,这是系统的正常行为:基础系统和snapd会受管理、更新并保持可靠。
现在安装AI推理快照:
sudo snap install gemma4
该命令会自动安装最适合当前机器的运行时和模型。
安装完成后,gemma4作为受管快照服务运行。可通过以下命令查看状态:
gemma4 status
输出内容包括活动引擎、服务和端点:
engine: cpu
services:
server: active
server-webui: active
endpoints:
openai: http://localhost:8336/v1
webui: http://localhost:8337/
此时推理服务器和WebUI已在Ubuntu Core实例内运行。但需要注意:这里的localhost指向Ubuntu Core虚拟机,而非宿主机。因此,宿主机浏览器暂时无法访问。
为使推理服务器和WebUI可从宿主机访问,需配置服务监听虚拟机的网络接口:
sudo gemma4 set http.host=0.0.0.0 webui.http.host=0.0.0.0 --assume-yes
然后在宿主机上查找虚拟机的IP地址:
multipass info aibox
输出包含IPv4地址:
Name: aibox
State: Running
Snapshots: 0
IPv4: 10.100.120.150
Release: Ubuntu Core 26
使用该IPv4地址访问推理服务器和WebUI(本例为10.100.120.150)。推理服务器的API地址为 http://<VM的IPv4>:8336/v1,兼容OpenAI协议,可配合各种客户端使用。例如通过cURL发起对话:
curl http://10.100.120.150:8336/chat/completions -H "Content-Type: application/json" -d '{
"messages": [{"role": "user", "content": "What is the meaning of ubuntu?"}],
"max_completion_tokens": 100
}'
当然,在终端里调用OpenAI API并不有趣。gemma4快照提供的WebUI更适合尝试。在浏览器中打开 http://10.100.120.150:8337 即可。
您还可以将此API与Open WebUI、OpenCode等工具集成,实现更多功能。
至此,您已在Ubuntu Core中成功运行了一个AI推理接口。
虽然本例在虚拟机中运行,但其架构与真实设备完全相同:Ubuntu Core基础系统与应用工作负载分离;AI服务器以快照形式交付;WebUI作为受管服务运行;推理端点位于Ubuntu Core环境中;配置通过快照选项而非手动编辑系统文件完成。
换句话说,您不仅仅是在安装一个软件包,而是在搭建一个设备的基础框架。
这一点至关重要,因为生产级设备很少通过逐条命令来管理。最终产品需要可预测的启动体验、受控的服务、可靠的更新,以及操作系统与应用层之间清晰的界限。
Ubuntu Core恰好提供了这一边界。
手动安装gemma4适合开发,但这并非产品交付的常规方式。
在生产部署中,AI快照及其配置通常包含在自定义的Ubuntu Core镜像中。该镜像由模型断言描述,定义了构成设备镜像的快照(包括必需或可选的应用快照)。采用这种方式后,设备启动时直接进入您设计的体验。
用户无需手动安装快照,无需登录Core实例,也无需了解推理端点如何配置。产品启动时便已具备正确的快照、服务、权限和默认设置。
这正是Ubuntu Core的强大之处:您在虚拟机中测试过的工作流程,可以演变为针对硬件、生产线、演示、客户试用或设备部署的可重复产品镜像。
设备部署后,工作并未结束。
您可能需要更新AI模型、修复推理服务器的CVE、调整配置,或向不同客户部署不同工作负载的相同镜像。Ubuntu Core通过快照通道和受控更新机制支持这些操作,确保设备在整个生命周期中安全、可靠、可维护。
关注微信号:智享开源 ,及时了解更新信息。
原文链接:https://ubuntu.com//blog/ubuntu-core-26-ai-box
你必须 登录 才能发表评论.
| 微信捐赠 | 支付宝捐赠 |
|---|---|
![]() |
![]() |
扫码关注公众号:智享开源

[blog_mailer_subscribe]
还没有任何评论,你来说两句吧!