感谢本站网友Broadwell的线索传递!
Nvidia最近发布了CUDA 12.0开发工具的更新这次更新带来了很多变化,包括支持最新的Hopper和阿达·洛芙莱斯GPU架构,升级C++方言,正式支持JIT LTO,改进和引入新的API等等
本站了解到CUDA 12.0的主要功能如下
Cu12.0为NVIDIA的Hopper和阿达·洛芙莱斯架构提供可编程功能CU12为Hopper和Ada架构提供了许多张量运算选项,其中许多支持通用的PTX中间表示合作网格阵列支持C内置函数,用于SM多播的可编程L2缓存,基因组学/DPX指令以及其他新功能
标记为CUDA_VISIBLE_DEVICES的GPU支持虚拟内存管理API。
应用程序和库开发人员可以通过编程来更新CUDA流的优先级。
与之前的API相比,改进后的CUDA动态并行化API的性能有了大幅提升。
现在正式支持通过nvJitLink库进行即时链接优化。
支持GCC 12.1主机编译器。
NVCC和NVRTC对C++20方言的支持。
NVRTC将其默认的C++方言从C++14更新到C++17。
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。