在中美科技竞争持续深入的背景下,人工智能计算生态的自主可控已成为关键议题。英伟达凭借其CUDA生态在全球AI训练与推理市场中占据主导地位,其于CUDA 11.6用户许可中明确禁止在其他硬件平台上通过翻译层运行CUDA,进一步强化了其生态封闭性。此前,AMD及Intel亦曾因兼容CUDA的相关尝试收到法律警告。

在这一背景下,华为昇腾所采取的一系列技术及生态策略引起行业高度关注。其路径可概括为:从专用ASIC转向通用GPGPU架构,全面开源其CANN软件栈,并借助社区力量实现CUDA生态兼容,以逐步构建自主可控且具备国际竞争力的AI算力体系。

人工智能基础软件生态:CUDA的主导地位

AI算力竞争已超越单纯硬件算力(TFLOPS)层面,演进为生态系统级别的较量。英伟达的核心壁垒并非仅源自GPU硬件,更在于其建立的CUDA(Compute Unified Device Architecture)软件生态。该生态包括编译器(NVCC)、高度优化的数学库(如cuBLAS、cuDNN)、调试与分析工具(Nsight),以及面向多种科学计算与AI场景的专用软件开发套件(SDK)。

全球数百万开发者及主流AI框架(如TensorFlow、PyTorch、JAX)均深度依赖CUDA进行开发和优化,形成强大的生态锁定效应。脱离CUDA意味着高昂的迁移成本与性能不确定性。此外,英伟达的最终用户许可协议(EULA)明确限制对其软件层进行逆向工程或转译,进一步提高了其他硬件厂商的兼容门槛。

昇腾的生态破局策略

面对CUDA生态的显著优势,华为昇腾采取了一套系统而分阶段的应对措施,涵盖硬件架构转型、软件开源与社区共建。

一、硬件架构转向通用GPGPU

早期昇腾芯片基于达芬奇架构,偏重专用矩阵计算,在通用性方面存在局限。为支持更广泛的AI模型及高性能计算(HPC)负载,新一代昇腾产品正朝通用GPGPU架构演进。据悉,2026年后规划的昇腾920(或称910D)将采用“矩阵 + 向量 + 线程 + CCU”复合架构,增强对稠密与稀疏张量运算、矩阵计算及高速通信的支持,从而为兼容CUDA提供硬件基础。

二、全面开源CANN,构建自主软件根社区

CANN(Compute Architecture for Neural Networks)作为昇腾的异构计算架构,是其软件生态的核心。近期华为宣布将CANN全面开源,这一举措具有多重意义:

  • 增强技术透明度,建立开发者信任;
    -吸引全球学术界及产业界参与贡献,形成围绕CANN的开放社区;
  • 为实现CUDA接口兼容提供底层技术支持。

开源CANN不仅是软件开放,更是为生态兼容铺设道路,其策略类似于华为鸿蒙早期通过兼容安卓应用实现用户平滑迁移。

三、以社区驱动实现CUDA兼容

由于法律与商业限制,昇腾官方无法直接实现CUDA兼容。因此其策略在于鼓励开源社区开发CUDA-on-Ascend转译层,具体可能通过以下方式实现:

  • 动态API转译:开发动态链接库,拦截CUDA API调用并将其转译为CANN调用。类似项目如ZLUDA(曾致力于在AMD平台实现CUDA兼容)已验证该路径技术可行性。
  • 静态代码转译:提供工具将CUDA C++代码编译为基于CANN的代码,类似Intel SYCLomatic实现CUDA至oneAPI的转换。

社区驱动的兼容层可规避单一实体的法律风险,同时符合开源精神。其成功依赖于众多编译器、系统软件和AI框架专家的共同贡献。

四、最终目标:无感迁移与生态融合

当兼容层覆盖绝大多数CUDA常用接口后,现有CU代码将可在昇腾硬件上运行,大幅降低生态迁移门槛。这不仅有助于承接现有CUDA开发生态,也为昇腾本土生态的成熟争取时间。

战略成功的关键挑战

实现CUDA兼容仍面临多项挑战,包括转译性能损耗、复杂库函数的完全复现,以及英伟达持续迭代带来的接口变动。此外,如何协调社区路线、保持兼容层持续更新,也将考验昇腾的生态运营能力。

总结和展望

企业对算力的需求,促进了算力平台的发展,天罡智算平台(https://www.tiangangaitp.com)就是其中的佼佼者:提供弹性GPU算力,灵活选择GPU类型和数量,按需动态使用,打破固定时长租期的束缚,只需为实际使用的资源付费。除了算力,还提供镜像、存储服务等一系列配套服务,并对完成实名认证的企业客户,提供4090 GPU 50个卡时的免费使用优惠。

华为昇腾所推行的,是一套从硬件通用化、软件开源到生态兼容的系统策略。其核心并非正面替代CUDA,而是通过硬件能力对齐、软件开源开放和社区共建兼容层,逐步实现对CUDA生态的承接与超越。这一战略能否成功,不仅影响昇腾自身的市场前景,也将为中国乃至全球AI算力格局带来重要变数。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐