Last active
October 23, 2019 20:21
-
-
Save mwrnd/430a96e5d3f3cfb20aa2fa1f60644416 to your computer and use it in GitHub Desktop.
AMD Radeon RX 570 Tensorflow benchmarking results with ROCm 2.8.13
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Video Card: AMD Radeon RX 570 8GB OC (rocm-smi -v VBIOS version: 113V34122-F3) | |
Motherboard: MSI X570-A Pro with 32GB DDR4-3000 BIOS H.40 | |
Processor: AMD Ryzen 5 3600X | |
OS: Ubuntu 18.04.2 no apt dist-upgrade | |
Kernel: 4.18.0-15-generic | |
rocm-dkms: 2.8.13 installed through apt | |
tensorflow-rocm: 1.14.2 installed through pip | |
tensorflow benchmarks: abb1aec2f2db4ba73fac2e1359227aef59b10258 | |
https://codeload.github.com/tensorflow/benchmarks/zip/abb1aec2f2db4ba73fac2e1359227aef59b10258 | |
tensorflow_models: 1.13.0 | |
https://codeload.github.com/tensorflow/models/zip/v1.13.0 | |
X means XLA was enabled | |
export TF_XLA_FLAGS=--tf_xla_cpu_global_jit | |
R means ROCm Fusion was enabled | |
export TF_ROCM_FUSION_ENABLE=1 | |
CU means MIOpen 36 Compute Unit optimations were used with this 32CU video card: | |
sudo cp /opt/rocm/miopen/share/miopen/db/gfx803_36.cd.pdb.txt /opt/rocm/miopen/share/miopen/db/gfx803_32.cd.pdb.txt | |
sudo cp /opt/rocm/miopen/share/miopen/db/gfx803_36.HIP.fdb.txt /opt/rocm/miopen/share/miopen/db/gfx803_32.HIP.fdb.txt | |
sudo cp /opt/rocm/miopen/share/miopen/db/gfx803_36.OpenCL.fdb.txt /opt/rocm/miopen/share/miopen/db/gfx803_32.OpenCL.fdb.txt | |
na means the benchmark did not run or could not due to batch size being too large | |
Notes: - trivial and official_ncf models have nnnR/nnnXR mistaken for nnnCU; some manual editing was needed | |
- averages and medians were calculated using LibreOffice Calc | |
==== images/sec results for various device, dataset, and model combinations ==== | |
CPU | |
cifar10 | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
trivial 17997 na na na na 32657 na 29370 na 48701 na 48277 na 63669 na 60794 na 73933 na 74017 na | |
CPU | |
imagenet | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
mobilenet 164 na na na na 188 na 188 na 201 na 201 na 207 na 207 na 211 na 210 na | |
official_ncf 182 na na 182 na 363 na 364 na 723 na 727 na 1451 na 1453 na 2896 na 2892 na | |
trivial 1652 na na na na 2203 na 2193 na 2802 na 2809 na 4458 na 4461 na 5202 na 5222 na | |
GPU | |
cifar10 | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
alexnet 2605 2603 na na na 4118 4126 na 4099 5650 5650 na 5564 6875 6858 na 6881 7415 7739 na 7756 | |
nasnet 40.3 39.3 na na 41.1 48.0 45.8 na 46.7 52.9 51.9 na 51.0 93.6 52.6 na 52.7 na na na na | |
resnet110 268 266 na na na 407 406 na 448 544 542 na 604 640 639 na 667 669 670 na 685 | |
resnet110_v2 268 268 na na 299 409 407 na 456 541 545 na 611 643 639 na 644 665 667 na 648 | |
resnet20 1338 1345 na na 1410 2056 2067 na 2224 2752 2751 na 2980 3278 3272 na 3373 3459 3467 na 3532 | |
resnet20_v2 1341 1313 na na 1442 2013 2021 na 2219 2684 2694 na 3000 3202 3189 na 3251 3390 3394 na 3346 | |
resnet32 872 865 na na 919 1343 1340 na 1445 1792 1790 na 1962 2111 2115 na 2190 2227 2230 na 2278 | |
resnet32_v2 871 861 na na 958 1321 1337 na 1476 1765 1767 na 1969 2083 2084 na 2121 2199 2202 na 2156 | |
resnet44 654 654 na na 690 994 989 na 1074 1321 1321 na 1452 1559 1558 na 1621 1642 1640 na 1681 | |
resnet44_v2 653 651 na na 713 990 984 na 1100 1311 1316 na 1463 1545 1543 na 1573 1622 1622 na 1593 | |
resnet56 518 516 na na 551 785 788 na 860 1050 1049 na 1159 1239 1239 na 1285 1296 1297 na 1327 | |
resnet56_v2 520 517 na na 574 780 781 na 878 1046 1046 na 1164 1226 1228 na 1247 1287 1291 na 1260 | |
trivial 6429 6426 na na na 12472 12350 na na 22757 23317 na na 42554 42425 na na 71642 70386 na na | |
GPU | |
coco | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
ssd300 13.9 14.4 na na na 14.7 14.8 na 15.0 14.9 15.0 na 15.2 na na na na na na na na | |
GPU | |
imagenet | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
alexnet 193 201 na na 203 258 280 na 270 311 343 na 344 340 380 na 381 355 396 na 390 | |
googlenet 121 119 na na 121 136 136 na 136 143 144 na 144 145 144 na 144 132 140 na 143 | |
inception3 22.3 22.4 na na 23.4 23.0 23.5 na 24.1 23.7 24.1 na 24.7 na na na na na na na na | |
inception4 10.7 10.5 na na na 10.9 11.0 na 11.2 na na na na na na na na na na na na | |
lenet5 3706 3738 na na na 6212 6097 na 6294 10154 9503 na 9752 14438 13263 na 13289 17627 16382 na 16272 | |
mobilenet 255 251 na na 258 316 322 na 332 359 362 na 365 361 385 na 367 388 392 na 399 | |
nasnet 7.9 7.3 na na 8.0 8.6 8.2 na 7.7 8.1 8.4 na 8.3 8.8 8.0 na 8.3 na na na na | |
official_ncf 1336 1336 na na na 2628 2650 na na 5294 5280 na na 10504 10384 na na 20786 20419 na na | |
overfeat 56.2 56.4 na na na 74.0 74.0 na 74.1 87.3 87.3 na 87.2 94.9 95.1 na 95.0 98.5 97.9 na 97.9 | |
resnet101 25.4 25.2 na na 26.6 28.7 28.9 na 30.1 na na na na na na na na na na na na | |
resnet101_v2 25.5 25.7 na na na 28.9 29.1 na 30.6 30.4 30.7 na 32.3 na na na na na na na na | |
resnet152 17.8 17.9 na na na 20.0 20.1 na 20.9 na na na na na na na na na na na na | |
resnet152_v2 17.9 18.0 na na na 20.1 20.2 na 21.2 na na na na na na na na na na na na | |
resnet50 44.9 44.8 na na na 49.7 50.0 na 52.3 51.7 52.5 na 55.1 na na na na na na na na | |
resnet50_v1.5 41.4 41.2 na na na 45.3 45.6 na 47.4 48.4 49.2 na 51.7 na na na na na na na na | |
resnet50_v2 45.2 45.2 na na na 50.4 50.6 na 53.5 52.5 53.1 na 56.2 na na na na na na na na | |
trivial 3456 na na na na 6517 6568 na na 12149 11984 na na 19495 19243 na na 26759 26603 na na | |
vgg11 33.3 33.3 na na 33.1 37.6 37.6 na 37.6 40.0 39.8 na 39.7 41.1 41.1 na 41.1 na na na na | |
vgg16 17.0 17.0 na na na 18.2 18.2 na 18.2 18.9 18.9 na 18.9 na na na na na na na na | |
vgg19 13.7 13.7 na na na 14.7 14.7 na 14.7 15.2 15.2 na 15.2 na na na na na na na na | |
==== Percentage Gains Relative to Baseline (runs with no flags set) ==== | |
CPU | |
cifar10 | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
trivial 0.00 na na na na 0.00 na -10.07 na 0.00 na -0.87 na 0.00 na -4.52 na 0.00 na 0.11 na | |
imagenet | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
mobilenet 0.00 na na na na 0.00 na 0.00 na 0.00 na 0.00 na 0.00 na 0.00 na 0.00 na -0.47 na | |
official_ncf 0.00 na na 0.00 na 0.00 na 0.28 na 0.00 na 0.55 na 0.00 na 0.14 na 0.00 na -0.14 na | |
trivial 0.00 na na na na 0.00 na -0.45 na 0.00 na 0.25 na 0.00 na 0.07 na 0.00 na 0.38 na | |
GPU | |
cifar10 | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
alexnet 0.00 -0.08 na na na 0.00 0.19 na -0.46 0.00 0.00 na -1.52 0.00 -0.25 na 0.09 0.00 4.37 na 4.60 | |
nasnet 0.00 -2.48 na na 1.99 0.00 -4.58 na -2.71 0.00 -1.89 na -3.59 0.00 -43.80 na -43.70 na na na na | |
resnet110 0.00 -0.75 na na na 0.00 -0.25 na 10.07 0.00 -0.37 na 11.03 0.00 -0.16 na 4.22 0.00 0.15 na 2.39 | |
resnet110_v2 0.00 0.00 na na 11.57 0.00 -0.49 na 11.49 0.00 0.74 na 12.94 0.00 -0.62 na 0.16 0.00 0.30 na -2.56 | |
resnet20 0.00 0.52 na na 5.38 0.00 0.54 na 8.17 0.00 -0.04 na 8.28 0.00 -0.18 na 2.90 0.00 0.23 na 2.11 | |
resnet20_v2 0.00 -2.09 na na 7.53 0.00 0.40 na 10.23 0.00 0.37 na 11.77 0.00 -0.41 na 1.53 0.00 0.12 na -1.30 | |
resnet32 0.00 -0.80 na na 5.39 0.00 -0.22 na 7.59 0.00 -0.11 na 9.49 0.00 0.19 na 3.74 0.00 0.13 na 2.29 | |
resnet32_v2 0.00 -1.15 na na 9.99 0.00 1.21 na 11.73 0.00 0.11 na 11.56 0.00 0.05 na 1.82 0.00 0.14 na -1.96 | |
resnet44 0.00 0.00 na na 5.50 0.00 -0.50 na 8.05 0.00 0.00 na 9.92 0.00 -0.06 na 3.98 0.00 -0.12 na 2.38 | |
resnet44_v2 0.00 -0.31 na na 9.19 0.00 -0.61 na 11.11 0.00 0.38 na 11.59 0.00 -0.13 na 1.81 0.00 0.00 na -1.79 | |
resnet56 0.00 -0.39 na na 6.37 0.00 0.38 na 9.55 0.00 -0.10 na 10.38 0.00 0.00 na 3.71 0.00 0.08 na 2.39 | |
resnet56_v2 0.00 -0.58 na na 10.38 0.00 0.13 na 12.56 0.00 0.00 na 11.28 0.00 0.16 na 1.71 0.00 0.31 na -2.10 | |
trivial 0.00 -0.05 na na na 0.00 -0.98 na na 0.00 2.46 na na 0.00 -0.30 na na 0.00 -1.75 na na | |
Average Gain -0.89% +7.33% -0.32% +8.12% -0.08% +8.60% -3.77% -1.50% +0.52% +0.59% | |
Median Gain (no na) -0.75% +6.95% -0.05% +9.81% +0.00% +10.71% -0.15% +1.82% +0.14% +2.11% | |
coco | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
ssd300 0.00 3.60 na na na 0.00 0.68 na 2.04 0.00 0.67 na 2.01 na na na na na na na na | |
imagenet | |
model batchsize=016 016CU 016R 016XR 016XRCU 032 032CU 032XR 032XRCU 064 064CU 064XR 064XRCU 128 128CU 128XR 128XRCU 256 256CU 256XR 256XRCU | |
alexnet 0.00 4.15 na na 5.18 0.00 8.53 na 4.65 0.00 10.29 na 10.61 0.00 11.76 na 12.06 0.00 11.55 na 9.86 | |
googlenet 0.00 -1.65 na na 0.00 0.00 0.00 na 0.00 0.00 0.70 na 0.70 0.00 -0.69 na -0.69 0.00 6.06 na 8.33 | |
inception3 0.00 0.45 na na 4.93 0.00 2.17 na 4.78 0.00 1.69 na 4.22 na na na na na na na na | |
inception4 0.00 -1.87 na na na 0.00 0.92 na 2.75 na na na na na na na na na na na na | |
lenet5 0.00 0.86 na na na 0.00 -1.85 na 1.32 0.00 -6.41 na -3.96 0.00 -8.14 na -7.96 0.00 -7.06 na -7.69 | |
mobilenet 0.00 -1.57 na na 1.18 0.00 1.90 na 5.06 0.00 0.84 na 1.67 0.00 6.65 na 1.66 0.00 1.03 na 2.84 | |
nasnet 0.00 -7.59 na na 1.27 0.00 -4.65 na -10.47 0.00 3.70 na 2.47 0.00 -9.09 na -5.68 na na na na | |
official_ncf 0.00 0.00 na na na 0.00 0.84 na na 0.00 -0.26 na 0.00 -1.14 na na na 0.00 -1.77 na na | |
overfeat 0.00 0.36 na na na 0.00 0.00 na 0.14 0.00 0.00 na -0.11 0.00 0.21 na 0.11 0.00 -0.61 na -0.61 | |
resnet101 0.00 -0.79 na na 4.72 0.00 0.70 na 4.88 na na na na na na na na na na na na | |
resnet101_v2 0.00 0.78 na na na 0.00 0.69 na 5.88 0.00 0.99 na 6.25 na na na na na na na na | |
resnet152 0.00 0.56 na na na 0.00 0.50 na 4.50 na na na na na na na na na na na na | |
resnet152_v2 0.00 0.56 na na na 0.00 0.50 na 5.47 na na na na na na na na na na na na | |
resnet50 0.00 -0.22 na na na 0.00 0.60 na 5.23 0.00 1.55 na 6.58 na na na na na na na na | |
resnet50_v1.5 0.00 -0.48 na na na 0.00 0.66 na 4.64 0.00 1.65 na 6.82 na na na na na na na na | |
resnet50_v2 0.00 0.00 na na na 0.00 0.40 na 6.15 0.00 1.14 na 7.05 na na na na na na na na | |
trivial 0.00 na na na na 0.00 0.78 na na 0.00 -1.36 na na 0.00 -1.29 na na 0.00 -0.58 na na | |
vgg11 0.00 0.00 na na -0.60 0.00 0.00 na 0.00 0.00 -0.50 na -0.75 0.00 0.00 na 0.00 na na na na | |
vgg16 0.00 0.00 na na na 0.00 0.00 na 0.00 0.00 0.00 na 0.00 na na na na na na na na | |
vgg19 0.00 0.00 na na na 0.00 0.00 na 0.00 0.00 0.00 na 0.00 na na na na na na na na | |
Average Gain -0.34% +2.38% +0.63% +2.50% +0.88% +2.97% -0.19% -0.08% +1.23% +2.55% | |
Median Gain (no na) +0.00% +1.27% +0.55% +4.57% +0.77% +2.07% -0.69% +0.00% -0.58% +2.84% | |
==== Results of a run of benchmarks with --compute_lr_on_cpu enabled ==== | |
imagenet dataset total images/sec: | |
python tf_cnn_benchmarks.py --device=GPU --num_gpus=1 --compute_lr_on_cpu \ | |
--batch_size={32,64,128} --num_batches=40 --model={model} --data_name=imagenet | |
model batchsize=32 32XR 32XRCU 64 64XR 64XRCU 128 128XR 128XRCU | |
trivial 6932 6605 6770 11413 12032 11353 19437 19221 19422 | |
alexnet 256 249 270 310 312 344 340 341 381 | |
googlenet 136 135 136 142 143 144 145 145 144 | |
inception3 23.0 23.5 24.1 23.7 24.2 24.7 na na na | |
inception4 10.5 11.1 11.2 na na na na na na | |
lenet 6096 5827 6198 10037 9069 9654 13078 12800 13380 | |
mobilenet 318 325 325 350 361 364 370 372 394 | |
nasnet 8.0 8.6 8.4 8.6 8.1 8.6 8.5 9.3 8.1 | |
ncf 2692 2665 2629 5230 5195 5279 10432 10420 10548 | |
overfeat 74.0 74.1 74.1 87.3 87.4 87.3 94.9 94.9 95.0 | |
resnet101 28.7 29.8 30.1 na na na na na na | |
resnet101_v2 28.9 30.4 30.6 30.4 32.0 32.3 na na na | |
resnet152 20.0 20.8 21.0 na na na na na na | |
resnet152_v2 20.1 21.1 21.3 na na na na na na | |
resnet50 49.8 51.9 52.4 51.9 54.5 55.2 na na na | |
resnet50_v1.5 45.3 47.5 47.6 48.4 50.8 51.8 na na na | |
resnet50_v2 50.4 53.2 53.5 52.5 55.6 56.3 na na na | |
vgg11 37.5 37.6 37.6 39.8 40.0 39.8 41.2 41.1 41.2 | |
vgg16 18.2 18.2 18.2 18.9 18.8 18.9 na na na | |
vgg19 14.7 14.7 14.7 15.2 15.2 15.2 na na na | |
ssd300/coco 14.7 14.9 15.0 14.9 15.2 15.1 na na na | |
Average Gain +1.8% +2.9% +0.9% +2.2% +0.3% +0.8% | |
Median Gain +2.1% +4.8% +0.5% +0.0% +0.0% +0.0% | |
cifar10 dataset total images/sec: | |
python tf_cnn_benchmarks.py --device=GPU --num_gpus=1 --compute_lr_on_cpu \ | |
--batch_size={32,64,128} --num_batches=40 --model={model} --data_name=cifar10 | |
model batchsize=32 32XR 32XRCU 64 64XR 64XRCU 128 128XR 128XRCU | |
trivial 13883 13926 13602 28210 25039 24818 46708 42483 42419 | |
alexnet 4102 4000 4210 5669 5620 5629 6608 6822 6899 | |
nasnet 47.1 47.0 49.5 51.3 52.2 51.3 48.4 53.7 53.4 | |
resnet110 408 448 448 544 605 606 644 667 667 | |
resnet110_v2 409 460 460 545 610 611 637 645 646 | |
resnet20 2122 2270 2285 2803 3057 3045 3314 3406 3409 | |
resnet20_v2 2092 2309 2311 2753 3055 3058 3237 3288 3292 | |
resnet32 1358 1477 1474 1807 1981 1981 2136 2205 2204 | |
resnet32_v2 1357 1514 1511 1788 1991 1991 2100 2134 2133 | |
resnet44 1001 1095 1091 1330 1472 1467 1566 1628 1628 | |
resnet44_v2 999 1116 1116 1322 1478 1481 1560 1578 1579 | |
resnet56 791 864 862 1056 1168 1166 1248 1289 1291 | |
resnet56_v2 791 885 886 1050 1175 1176 1240 1250 1252 | |
Average Gain +6.2% +6.7% +6.2% +6.0% +1.8% +1.8% | |
Median Gain +9.0% +8.8% +10 +10% +1.6% +1.6% |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment