Skip to content

Instantly share code, notes, and snippets.

@hewumars
Last active August 9, 2020 07:53
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save hewumars/3631ad794aa19fa4ad3d7f5589912c5b to your computer and use it in GitHub Desktop.
Save hewumars/3631ad794aa19fa4ad3d7f5589912c5b to your computer and use it in GitHub Desktop.

  1. 安培架构:全球最大7nm芯片,拥有542亿个晶体管,采用40GB三星HBM2,内存带宽可达到1.6 Tbps。高带宽的HBM2内存和更大、更快的缓存为增加的CUDA Core和Tensor Core提供数据。
  2. 第三代Tensor Core:处理速度更快、更灵活,TF32精度可将AI性能提升20倍。16x16大张量运算单元。而图灵架构是4x4小单元。
  3. 结构化稀疏:进一步将AI推理性能提升2倍。
  4. 多实例GPU:每个GPU可分成7个并发实例,优化GPU利用率。
  5. 第三代NVLink和NVSwitch:高效可扩展,带宽较上一代提升2倍有余。

2080TITensorCore性能

Tesla T4是一款独特的GPU产品,专为AI推理工作负载而设计,如处理视频,语音,搜索引擎和图像的神经网络。Tesla T4配备16GB GDDR6,GPU中集成320个Turing Tensor Core和2560个Turing CUDA Core,功耗75W,这款全新GPU具有突破性的性能,以及FP32/FP16/INT8/INT4等多种精度的运算能力,FP16的峰值性能为65T,INT8为130T,INT4为260T。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment