- 安培架构:全球最大7nm芯片,拥有542亿个晶体管,采用40GB三星HBM2,内存带宽可达到1.6 Tbps。高带宽的HBM2内存和更大、更快的缓存为增加的CUDA Core和Tensor Core提供数据。
- 第三代Tensor Core:处理速度更快、更灵活,TF32精度可将AI性能提升20倍。16x16大张量运算单元。而图灵架构是4x4小单元。
- 结构化稀疏:进一步将AI推理性能提升2倍。
- 多实例GPU:每个GPU可分成7个并发实例,优化GPU利用率。
- 第三代NVLink和NVSwitch:高效可扩展,带宽较上一代提升2倍有余。
Tesla T4是一款独特的GPU产品,专为AI推理工作负载而设计,如处理视频,语音,搜索引擎和图像的神经网络。Tesla T4配备16GB GDDR6,GPU中集成320个Turing Tensor Core和2560个Turing CUDA Core,功耗75W,这款全新GPU具有突破性的性能,以及FP32/FP16/INT8/INT4等多种精度的运算能力,FP16的峰值性能为65T,INT8为130T,INT4为260T。