新的PC要来了
今天,英伟达在台北 GTC 2026 上发布了一件真正值得记录的东西。
不是又一张更快的显卡。
是 RTX Spark——一套重新定义消费级 PC 的芯片和平台,老黄用的词是"个人电脑诞生40年以来,这次要重新定义"。
我觉得这话没有夸张。
问题出在哪
过去两年,AI 进步的主战场在云端。
OpenAI、Claude Code、Codex,全部跑在数据中心的 GPU 集群上。本地端的硬件几乎没有实质突破。
与此同时,每个人心里都有一个想法:把大模型真正跑在自己的机器上,低延迟、隐私保护、不依赖网络,甚至可以微调。
问题是,做不到。
根本卡点在两个地方:统一内存,和 CUDA 生态。
而这两件事,以前在同一台消费级 PC 上从来不能兼得。
统一内存是什么,为什么关键
传统 PC 里,CPU 有自己的系统内存(RAM),GPU 有自己的显存(VRAM),两者之间靠 PCIe 通道交换数据。
GPU 读自己的显存,带宽约 1TB/s。
PCIe 通道的带宽,约 32GB/s。
差了三十倍。
这意味着,当你想在本地跑一个 70B 的大模型,模型权重放不进 GPU 显存,就必须频繁穿越这条"慢道"从 CPU 内存拉数据。跑起来要么极慢,要么直接失败。
统一内存把这两块合成一个共享池。CPU 和 GPU 共用同一块内存,不再有"慢道"的概念。
苹果把这套架构做进了 M 系列芯片,Mac 的本地推理体验因此领先 Windows 几年。
但苹果有一个致命短板:Metal,而不是 CUDA。
CUDA 才是护城河
CUDA 不是驱动,不是加速技术。
它是一套积累了将近二十年的完整生态。
底层是让 GPU 做通用计算的编程模型;中层是 cuBLAS、cuDNN、TensorRT、NCCL 这些经过无数工程师打磨的数学库;上层是 PyTorch、TensorFlow、JAX——几乎所有深度学习框架的 GPU 后端默认都是 CUDA。
今天你在 arXiv 找一篇论文,拉下来的开源代码,99% 先在 CUDA 上写和测。遇到问题去搜,搜到的答案默认你在用 CUDA。
整个 AI 工程界的母语,就是 CUDA。
苹果的 MLX 是很好的尝试,但它的训练和微调生态到今天还非常薄弱。你能跑推理,但一旦想自己微调模型,就会发现四处碰壁。
所以"把大模型真正跑在本地"这件事,理想的答案一直是:统一内存 + CUDA,缺一不可。
RTX Spark 第一次把这两件事捏在了一起
旗舰版参数:128GB LPDDR5X 统一内存,1 PFLOP FP4 AI 性能,6144 个 GPU 核心,可以直接本地运行 120B 的模型。
同时,完整的 CUDA 生态。所有已有的模型、微调工具、推理框架,开箱即用。
这是以前任何一个消费级平台都给不了的组合。
配合这次的发布,Adobe 针对 RTX Spark 重新设计了 Photoshop 和 Premiere 的核心架构,速度提升两倍,并原生支持 Agent 调用。微软则和英伟达一起,重构 Windows 系统,让本地 Agent 的运行成为原生能力——包括身份认证、隔离防护、策略管控这套安全基元,还有英伟达自己的 Open Shell。
换句话说,这次不只是一块芯片,而是一套软硬件联动的平台:底层 RTX Spark、中层重构的 Windows、上层完整的 CUDA-X Agent 生态。
换机潮的节奏
硬件都在展示台上了。联想、HP 的新品,14mm 厚的笔记本,还有类似 Mac Mini 的小盒子,都在这次发布会上亮了相。
产品要到明年才会铺开。
但信号已经很清晰了:这是 Windows 生态沉寂多年后,第一次真正有能力反攻苹果 M 系列在 AI 本地计算上的优势。
而且它带着整个 CUDA 生态来的。
这就是 RTX Spark 的历史意义——不是参数更好的显卡,是一个新的起点。
A New Line,A New Beginning。