新的PC要来了

2026-06-01

今天，英伟达在台北 GTC 2026 上发布了一件真正值得记录的东西。

不是又一张更快的显卡。

是 RTX Spark——一套重新定义消费级 PC 的芯片和平台，老黄用的词是"个人电脑诞生40年以来，这次要重新定义"。

我觉得这话没有夸张。

问题出在哪

过去两年，AI 进步的主战场在云端。

OpenAI、Claude Code、Codex，全部跑在数据中心的 GPU 集群上。本地端的硬件几乎没有实质突破。

与此同时，每个人心里都有一个想法：把大模型真正跑在自己的机器上，低延迟、隐私保护、不依赖网络，甚至可以微调。

问题是，做不到。

根本卡点在两个地方：统一内存，和 CUDA 生态。

而这两件事，以前在同一台消费级 PC 上从来不能兼得。

统一内存是什么，为什么关键

传统 PC 里，CPU 有自己的系统内存（RAM），GPU 有自己的显存（VRAM），两者之间靠 PCIe 通道交换数据。

GPU 读自己的显存，带宽约 1TB/s。

PCIe 通道的带宽，约 32GB/s。

差了三十倍。

这意味着，当你想在本地跑一个 70B 的大模型，模型权重放不进 GPU 显存，就必须频繁穿越这条"慢道"从 CPU 内存拉数据。跑起来要么极慢，要么直接失败。

统一内存把这两块合成一个共享池。CPU 和 GPU 共用同一块内存，不再有"慢道"的概念。

苹果把这套架构做进了 M 系列芯片，Mac 的本地推理体验因此领先 Windows 几年。

但苹果有一个致命短板：Metal，而不是 CUDA。

CUDA 才是护城河

CUDA 不是驱动，不是加速技术。

它是一套积累了将近二十年的完整生态。

底层是让 GPU 做通用计算的编程模型；中层是 cuBLAS、cuDNN、TensorRT、NCCL 这些经过无数工程师打磨的数学库；上层是 PyTorch、TensorFlow、JAX——几乎所有深度学习框架的 GPU 后端默认都是 CUDA。

今天你在 arXiv 找一篇论文，拉下来的开源代码，99% 先在 CUDA 上写和测。遇到问题去搜，搜到的答案默认你在用 CUDA。

整个 AI 工程界的母语，就是 CUDA。

苹果的 MLX 是很好的尝试，但它的训练和微调生态到今天还非常薄弱。你能跑推理，但一旦想自己微调模型，就会发现四处碰壁。

所以"把大模型真正跑在本地"这件事，理想的答案一直是：统一内存 + CUDA，缺一不可。

RTX Spark 第一次把这两件事捏在了一起

旗舰版参数：128GB LPDDR5X 统一内存，1 PFLOP FP4 AI 性能，6144 个 GPU 核心，可以直接本地运行 120B 的模型。

同时，完整的 CUDA 生态。所有已有的模型、微调工具、推理框架，开箱即用。

这是以前任何一个消费级平台都给不了的组合。

配合这次的发布，Adobe 针对 RTX Spark 重新设计了 Photoshop 和 Premiere 的核心架构，速度提升两倍，并原生支持 Agent 调用。微软则和英伟达一起，重构 Windows 系统，让本地 Agent 的运行成为原生能力——包括身份认证、隔离防护、策略管控这套安全基元，还有英伟达自己的 Open Shell。

换句话说，这次不只是一块芯片，而是一套软硬件联动的平台：底层 RTX Spark、中层重构的 Windows、上层完整的 CUDA-X Agent 生态。

换机潮的节奏

硬件都在展示台上了。联想、HP 的新品，14mm 厚的笔记本，还有类似 Mac Mini 的小盒子，都在这次发布会上亮了相。

产品要到明年才会铺开。

但信号已经很清晰了：这是 Windows 生态沉寂多年后，第一次真正有能力反攻苹果 M 系列在 AI 本地计算上的优势。

而且它带着整个 CUDA 生态来的。

这就是 RTX Spark 的历史意义——不是参数更好的显卡，是一个新的起点。

A New Line，A New Beginning。