Skip to content

Instantly share code, notes, and snippets.

@bwesterb
Created June 6, 2018 08:22
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save bwesterb/1daba528b15e1073498a16e2ab34672a to your computer and use it in GitHub Desktop.
Save bwesterb/1daba528b15e1073498a16e2ab34672a to your computer and use it in GitHub Desktop.
.section __TEXT,__text,regular,pure_instructions
.macosx_version_min 10, 13
.intel_syntax noprefix
.section __TEXT,__literal8,8byte_literals
.p2align 3 ## -- Begin function Sha256Init8x
LCPI0_0:
.quad 7640891574645810791 ## 0x6a09e6676a09e667
LCPI0_1:
.quad -4942790176617812347 ## 0xbb67ae85bb67ae85
LCPI0_2:
.quad 4354685561679573874 ## 0x3c6ef3723c6ef372
LCPI0_3:
.quad -6534734902060911302 ## 0xa54ff53aa54ff53a
LCPI0_4:
.quad 5840696473520329343 ## 0x510e527f510e527f
LCPI0_5:
.quad -7276294669841635188 ## 0x9b05688c9b05688c
LCPI0_6:
.quad 2270897966116231595 ## 0x1f83d9ab1f83d9ab
LCPI0_7:
.quad 6620516961033964825 ## 0x5be0cd195be0cd19
.section __TEXT,__text,regular,pure_instructions
.globl _Sha256Init8x
_Sha256Init8x: ## @Sha256Init8x
## BB#0:
push rbp
mov rbp, rsp
and rsp, -8
vpbroadcastq xmm0, qword ptr [rip + LCPI0_0] ## xmm0 = [7640891574645810791,7640891574645810791]
vmovdqa xmmword ptr [rdi + 16], xmm0
vmovdqa xmmword ptr [rdi], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_1] ## xmm0 = [13503953897091739269,13503953897091739269]
vmovdqa xmmword ptr [rdi + 48], xmm0
vmovdqa xmmword ptr [rdi + 32], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_2] ## xmm0 = [4354685561679573874,4354685561679573874]
vmovdqa xmmword ptr [rdi + 80], xmm0
vmovdqa xmmword ptr [rdi + 64], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_3] ## xmm0 = [11912009171648640314,11912009171648640314]
vmovdqa xmmword ptr [rdi + 112], xmm0
vmovdqa xmmword ptr [rdi + 96], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_4] ## xmm0 = [5840696473520329343,5840696473520329343]
vmovdqa xmmword ptr [rdi + 144], xmm0
vmovdqa xmmword ptr [rdi + 128], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_5] ## xmm0 = [11170449403867916428,11170449403867916428]
vmovdqa xmmword ptr [rdi + 176], xmm0
vmovdqa xmmword ptr [rdi + 160], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_6] ## xmm0 = [2270897966116231595,2270897966116231595]
vmovdqa xmmword ptr [rdi + 208], xmm0
vmovdqa xmmword ptr [rdi + 192], xmm0
vpbroadcastq xmm0, qword ptr [rip + LCPI0_7] ## xmm0 = [6620516961033964825,6620516961033964825]
vmovdqa xmmword ptr [rdi + 240], xmm0
vmovdqa xmmword ptr [rdi + 224], xmm0
mov dword ptr [rdi + 768], 0
mov qword ptr [rdi + 776], 0
mov rsp, rbp
pop rbp
ret
## -- End function
.globl _Sha256Update8x ## -- Begin function Sha256Update8x
_Sha256Update8x: ## @Sha256Update8x
## BB#0:
push rbp
mov rbp, rsp
push r15
push r14
push r13
push r12
push rbx
and rsp, -16
sub rsp, 112
mov qword ptr [rsp + 96], r9 ## 8-byte Spill
mov qword ptr [rsp + 88], r8 ## 8-byte Spill
mov qword ptr [rsp + 80], rcx ## 8-byte Spill
mov qword ptr [rsp + 72], rdx ## 8-byte Spill
mov qword ptr [rsp + 64], rsi ## 8-byte Spill
mov r14, rdi
mov rbx, qword ptr [rbp + 40]
test rbx, rbx
je LBB1_5
## BB#1:
lea r15, [r14 + 256]
lea rax, [r14 + 320]
mov qword ptr [rsp + 56], rax ## 8-byte Spill
lea rax, [r14 + 384]
mov qword ptr [rsp + 48], rax ## 8-byte Spill
lea rax, [r14 + 448]
mov qword ptr [rsp + 40], rax ## 8-byte Spill
lea rax, [r14 + 512]
mov qword ptr [rsp + 32], rax ## 8-byte Spill
lea rax, [r14 + 576]
mov qword ptr [rsp + 24], rax ## 8-byte Spill
lea rax, [r14 + 640]
mov qword ptr [rsp + 16], rax ## 8-byte Spill
lea rax, [r14 + 704]
mov qword ptr [rsp + 8], rax ## 8-byte Spill
xor r13d, r13d
LBB1_2: ## =>This Inner Loop Header: Depth=1
mov r12, r13
mov r13, rbx
sub r13, r12
mov eax, 64
cmp r13, rax
cmovae r13, rax
mov rax, qword ptr [rsp + 64] ## 8-byte Reload
lea rsi, [rax + r12]
mov rdi, r15
mov rdx, r13
call _memcpy
mov rax, qword ptr [rsp + 72] ## 8-byte Reload
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 56] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov rax, qword ptr [rsp + 80] ## 8-byte Reload
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 48] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov rax, qword ptr [rsp + 88] ## 8-byte Reload
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 40] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov rax, qword ptr [rsp + 96] ## 8-byte Reload
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 32] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov rax, qword ptr [rbp + 16]
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 24] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov rax, qword ptr [rbp + 24]
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 16] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov rax, qword ptr [rbp + 32]
lea rsi, [rax + r12]
mov rdi, qword ptr [rsp + 8] ## 8-byte Reload
mov rdx, r13
call _memcpy
mov eax, dword ptr [r14 + 768]
add eax, r13d
mov dword ptr [r14 + 768], eax
add r13, r12
cmp eax, 64
jne LBB1_4
## BB#3: ## in Loop: Header=BB1_2 Depth=1
mov rdi, r14
mov rsi, r15
call _sha256_transform8x
add qword ptr [r14 + 776], 512
mov dword ptr [r14 + 768], 0
LBB1_4: ## in Loop: Header=BB1_2 Depth=1
cmp r13, rbx
jb LBB1_2
LBB1_5:
lea rsp, [rbp - 40]
pop rbx
pop r12
pop r13
pop r14
pop r15
pop rbp
ret
## -- End function
.section __TEXT,__const
.p2align 5 ## -- Begin function sha256_transform8x
LCPI2_0:
.byte 3 ## 0x3
.byte 2 ## 0x2
.byte 1 ## 0x1
.byte 0 ## 0x0
.byte 7 ## 0x7
.byte 6 ## 0x6
.byte 5 ## 0x5
.byte 4 ## 0x4
.byte 11 ## 0xb
.byte 10 ## 0xa
.byte 9 ## 0x9
.byte 8 ## 0x8
.byte 15 ## 0xf
.byte 14 ## 0xe
.byte 13 ## 0xd
.byte 12 ## 0xc
.byte 3 ## 0x3
.byte 2 ## 0x2
.byte 1 ## 0x1
.byte 0 ## 0x0
.byte 7 ## 0x7
.byte 6 ## 0x6
.byte 5 ## 0x5
.byte 4 ## 0x4
.byte 11 ## 0xb
.byte 10 ## 0xa
.byte 9 ## 0x9
.byte 8 ## 0x8
.byte 15 ## 0xf
.byte 14 ## 0xe
.byte 13 ## 0xd
.byte 12 ## 0xc
.section __TEXT,__literal4,4byte_literals
.p2align 2
LCPI2_1:
.long 1116352408 ## 0x428a2f98
LCPI2_2:
.long 1899447441 ## 0x71374491
LCPI2_3:
.long 3049323471 ## 0xb5c0fbcf
LCPI2_4:
.long 3921009573 ## 0xe9b5dba5
LCPI2_5:
.long 961987163 ## 0x3956c25b
LCPI2_6:
.long 1508970993 ## 0x59f111f1
LCPI2_7:
.long 2453635748 ## 0x923f82a4
LCPI2_8:
.long 2870763221 ## 0xab1c5ed5
LCPI2_9:
.long 3624381080 ## 0xd807aa98
LCPI2_10:
.long 310598401 ## 0x12835b01
LCPI2_11:
.long 607225278 ## 0x243185be
LCPI2_12:
.long 1426881987 ## 0x550c7dc3
LCPI2_13:
.long 1925078388 ## 0x72be5d74
LCPI2_14:
.long 2162078206 ## 0x80deb1fe
LCPI2_15:
.long 2614888103 ## 0x9bdc06a7
LCPI2_16:
.long 3248222580 ## 0xc19bf174
LCPI2_17:
.long 3835390401 ## 0xe49b69c1
LCPI2_18:
.long 4022224774 ## 0xefbe4786
LCPI2_19:
.long 264347078 ## 0xfc19dc6
LCPI2_20:
.long 604807628 ## 0x240ca1cc
LCPI2_21:
.long 770255983 ## 0x2de92c6f
LCPI2_22:
.long 1249150122 ## 0x4a7484aa
LCPI2_23:
.long 1555081692 ## 0x5cb0a9dc
LCPI2_24:
.long 1996064986 ## 0x76f988da
LCPI2_25:
.long 2554220882 ## 0x983e5152
LCPI2_26:
.long 2821834349 ## 0xa831c66d
LCPI2_27:
.long 2952996808 ## 0xb00327c8
LCPI2_28:
.long 3210313671 ## 0xbf597fc7
LCPI2_29:
.long 3336571891 ## 0xc6e00bf3
LCPI2_30:
.long 3584528711 ## 0xd5a79147
LCPI2_31:
.long 113926993 ## 0x6ca6351
LCPI2_32:
.long 338241895 ## 0x14292967
LCPI2_33:
.long 666307205 ## 0x27b70a85
LCPI2_34:
.long 773529912 ## 0x2e1b2138
LCPI2_35:
.long 1294757372 ## 0x4d2c6dfc
LCPI2_36:
.long 1396182291 ## 0x53380d13
LCPI2_37:
.long 1695183700 ## 0x650a7354
LCPI2_38:
.long 1986661051 ## 0x766a0abb
LCPI2_39:
.long 2177026350 ## 0x81c2c92e
LCPI2_40:
.long 2456956037 ## 0x92722c85
LCPI2_41:
.long 2730485921 ## 0xa2bfe8a1
LCPI2_42:
.long 2820302411 ## 0xa81a664b
LCPI2_43:
.long 3259730800 ## 0xc24b8b70
LCPI2_44:
.long 3345764771 ## 0xc76c51a3
LCPI2_45:
.long 3516065817 ## 0xd192e819
LCPI2_46:
.long 3600352804 ## 0xd6990624
LCPI2_47:
.long 4094571909 ## 0xf40e3585
LCPI2_48:
.long 275423344 ## 0x106aa070
LCPI2_49:
.long 430227734 ## 0x19a4c116
LCPI2_50:
.long 506948616 ## 0x1e376c08
LCPI2_51:
.long 659060556 ## 0x2748774c
LCPI2_52:
.long 883997877 ## 0x34b0bcb5
LCPI2_53:
.long 958139571 ## 0x391c0cb3
LCPI2_54:
.long 1322822218 ## 0x4ed8aa4a
LCPI2_55:
.long 1537002063 ## 0x5b9cca4f
LCPI2_56:
.long 1747873779 ## 0x682e6ff3
LCPI2_57:
.long 1955562222 ## 0x748f82ee
LCPI2_58:
.long 2024104815 ## 0x78a5636f
LCPI2_59:
.long 2227730452 ## 0x84c87814
LCPI2_60:
.long 2361852424 ## 0x8cc70208
LCPI2_61:
.long 2428436474 ## 0x90befffa
LCPI2_62:
.long 2756734187 ## 0xa4506ceb
LCPI2_63:
.long 3204031479 ## 0xbef9a3f7
LCPI2_64:
.long 3329325298 ## 0xc67178f2
.section __TEXT,__text,regular,pure_instructions
_sha256_transform8x: ## @sha256_transform8x
## BB#0:
push rbp
mov rbp, rsp
and rsp, -32
sub rsp, 2976
mov rax, qword ptr [rip + ___stack_chk_guard@GOTPCREL]
mov rax, qword ptr [rax]
mov qword ptr [rsp + 2952], rax
xor eax, eax
vmovdqa ymm0, ymmword ptr [rip + LCPI2_0] ## ymm0 = [3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12,3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]
LBB2_1: ## =>This Inner Loop Header: Depth=1
vmovdqu xmm1, xmmword ptr [rsi + 2*rax]
vinserti128 ymm1, ymm1, xmmword ptr [rsi + 2*rax + 16], 1
vpshufb ymm1, ymm1, ymm0
vmovdqa ymmword ptr [rsp + rax + 896], ymm1
vmovdqu xmm1, xmmword ptr [rsi + 2*rax + 32]
vinserti128 ymm1, ymm1, xmmword ptr [rsi + 2*rax + 48], 1
vpshufb ymm1, ymm1, ymm0
vmovdqa ymmword ptr [rsp + rax + 1152], ymm1
add rax, 32
cmp rax, 256
jne LBB2_1
## BB#2:
vmovdqa ymm0, ymmword ptr [rsp + 896]
vmovdqa ymm1, ymmword ptr [rsp + 928]
vmovdqa ymm2, ymmword ptr [rsp + 960]
vmovdqa ymm3, ymmword ptr [rsp + 992]
vpunpckldq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5]
vpunpckhdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7]
vpunpckldq ymm1, ymm2, ymm3 ## ymm1 = ymm2[0],ymm3[0],ymm2[1],ymm3[1],ymm2[4],ymm3[4],ymm2[5],ymm3[5]
vpunpckhdq ymm2, ymm2, ymm3 ## ymm2 = ymm2[2],ymm3[2],ymm2[3],ymm3[3],ymm2[6],ymm3[6],ymm2[7],ymm3[7]
vmovdqa ymm3, ymmword ptr [rsp + 1024]
vmovdqa ymm5, ymmword ptr [rsp + 1056]
vpunpckldq ymm6, ymm3, ymm5 ## ymm6 = ymm3[0],ymm5[0],ymm3[1],ymm5[1],ymm3[4],ymm5[4],ymm3[5],ymm5[5]
vpunpckhdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[2],ymm5[2],ymm3[3],ymm5[3],ymm3[6],ymm5[6],ymm3[7],ymm5[7]
vmovdqa ymm5, ymmword ptr [rsp + 1088]
vmovdqa ymm7, ymmword ptr [rsp + 1120]
vpunpckldq ymm8, ymm5, ymm7 ## ymm8 = ymm5[0],ymm7[0],ymm5[1],ymm7[1],ymm5[4],ymm7[4],ymm5[5],ymm7[5]
vpunpckhdq ymm5, ymm5, ymm7 ## ymm5 = ymm5[2],ymm7[2],ymm5[3],ymm7[3],ymm5[6],ymm7[6],ymm5[7],ymm7[7]
vpunpcklqdq ymm7, ymm4, ymm1 ## ymm7 = ymm4[0],ymm1[0],ymm4[2],ymm1[2]
vpunpckhqdq ymm1, ymm4, ymm1 ## ymm1 = ymm4[1],ymm1[1],ymm4[3],ymm1[3]
vpunpcklqdq ymm4, ymm0, ymm2 ## ymm4 = ymm0[0],ymm2[0],ymm0[2],ymm2[2]
vpunpckhqdq ymm0, ymm0, ymm2 ## ymm0 = ymm0[1],ymm2[1],ymm0[3],ymm2[3]
vpunpcklqdq ymm2, ymm6, ymm8 ## ymm2 = ymm6[0],ymm8[0],ymm6[2],ymm8[2]
vpunpckhqdq ymm6, ymm6, ymm8 ## ymm6 = ymm6[1],ymm8[1],ymm6[3],ymm8[3]
vpunpcklqdq ymm8, ymm3, ymm5 ## ymm8 = ymm3[0],ymm5[0],ymm3[2],ymm5[2]
vpunpckhqdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[1],ymm5[1],ymm3[3],ymm5[3]
vinserti128 ymm5, ymm7, xmm2, 1
vmovdqa ymmword ptr [rsp + 896], ymm5
vmovdqa ymm9, ymm5
vmovdqa ymmword ptr [rsp + 192], ymm9 ## 32-byte Spill
vinserti128 ymm5, ymm1, xmm6, 1
vmovdqa ymmword ptr [rsp + 928], ymm5
vinserti128 ymm5, ymm4, xmm8, 1
vmovdqa ymmword ptr [rsp + 960], ymm5
vinserti128 ymm5, ymm0, xmm3, 1
vmovdqa ymmword ptr [rsp + 992], ymm5
vperm2i128 ymm2, ymm7, ymm2, 49 ## ymm2 = ymm7[2,3],ymm2[2,3]
vmovdqa ymmword ptr [rsp + 1024], ymm2
vperm2i128 ymm1, ymm1, ymm6, 49 ## ymm1 = ymm1[2,3],ymm6[2,3]
vmovdqa ymmword ptr [rsp + 1056], ymm1
vperm2i128 ymm11, ymm4, ymm8, 49 ## ymm11 = ymm4[2,3],ymm8[2,3]
vmovdqa ymmword ptr [rsp + 1088], ymm11
vmovdqa ymmword ptr [rsp + 384], ymm11 ## 32-byte Spill
vperm2i128 ymm0, ymm0, ymm3, 49 ## ymm0 = ymm0[2,3],ymm3[2,3]
vmovdqa ymmword ptr [rsp], ymm0 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1120], ymm0
vmovdqa ymm0, ymmword ptr [rsp + 1152]
vmovdqa ymm1, ymmword ptr [rsp + 1184]
vpunpckldq ymm2, ymm0, ymm1 ## ymm2 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5]
vpunpckhdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7]
vmovdqa ymm1, ymmword ptr [rsp + 1216]
vmovdqa ymm3, ymmword ptr [rsp + 1248]
vpunpckldq ymm4, ymm1, ymm3 ## ymm4 = ymm1[0],ymm3[0],ymm1[1],ymm3[1],ymm1[4],ymm3[4],ymm1[5],ymm3[5]
vpunpckhdq ymm1, ymm1, ymm3 ## ymm1 = ymm1[2],ymm3[2],ymm1[3],ymm3[3],ymm1[6],ymm3[6],ymm1[7],ymm3[7]
vmovdqa ymm3, ymmword ptr [rsp + 1280]
vmovdqa ymm5, ymmword ptr [rsp + 1312]
vpunpckldq ymm6, ymm3, ymm5 ## ymm6 = ymm3[0],ymm5[0],ymm3[1],ymm5[1],ymm3[4],ymm5[4],ymm3[5],ymm5[5]
vpunpckhdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[2],ymm5[2],ymm3[3],ymm5[3],ymm3[6],ymm5[6],ymm3[7],ymm5[7]
vmovdqa ymm5, ymmword ptr [rsp + 1344]
vmovdqa ymm7, ymmword ptr [rsp + 1376]
vpunpckldq ymm8, ymm5, ymm7 ## ymm8 = ymm5[0],ymm7[0],ymm5[1],ymm7[1],ymm5[4],ymm7[4],ymm5[5],ymm7[5]
vpunpckhdq ymm5, ymm5, ymm7 ## ymm5 = ymm5[2],ymm7[2],ymm5[3],ymm7[3],ymm5[6],ymm7[6],ymm5[7],ymm7[7]
vpunpcklqdq ymm7, ymm2, ymm4 ## ymm7 = ymm2[0],ymm4[0],ymm2[2],ymm4[2]
vpunpckhqdq ymm2, ymm2, ymm4 ## ymm2 = ymm2[1],ymm4[1],ymm2[3],ymm4[3]
vpunpcklqdq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[2],ymm1[2]
vpunpckhqdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3]
vpunpcklqdq ymm1, ymm6, ymm8 ## ymm1 = ymm6[0],ymm8[0],ymm6[2],ymm8[2]
vpunpckhqdq ymm6, ymm6, ymm8 ## ymm6 = ymm6[1],ymm8[1],ymm6[3],ymm8[3]
vpunpcklqdq ymm8, ymm3, ymm5 ## ymm8 = ymm3[0],ymm5[0],ymm3[2],ymm5[2]
vpunpckhqdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[1],ymm5[1],ymm3[3],ymm5[3]
vinserti128 ymm5, ymm7, xmm1, 1
vmovdqa ymmword ptr [rsp + 352], ymm5 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1152], ymm5
vinserti128 ymm5, ymm2, xmm6, 1
vmovdqa ymmword ptr [rsp + 224], ymm5 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1184], ymm5
vinserti128 ymm5, ymm4, xmm8, 1
vmovdqa ymmword ptr [rsp + 128], ymm5 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1216], ymm5
vinserti128 ymm5, ymm0, xmm3, 1
vmovdqa ymmword ptr [rsp + 160], ymm5 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1248], ymm5
vperm2i128 ymm1, ymm7, ymm1, 49 ## ymm1 = ymm7[2,3],ymm1[2,3]
vmovdqa ymmword ptr [rsp + 32], ymm1 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1280], ymm1
vperm2i128 ymm1, ymm2, ymm6, 49 ## ymm1 = ymm2[2,3],ymm6[2,3]
vmovdqa ymmword ptr [rsp + 480], ymm1 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1312], ymm1
vperm2i128 ymm1, ymm4, ymm8, 49 ## ymm1 = ymm4[2,3],ymm8[2,3]
vmovdqa ymmword ptr [rsp + 320], ymm1 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1344], ymm1
vperm2i128 ymm0, ymm0, ymm3, 49 ## ymm0 = ymm0[2,3],ymm3[2,3]
vmovdqa ymmword ptr [rsp + 256], ymm0 ## 32-byte Spill
vmovdqa ymmword ptr [rsp + 1376], ymm0
vmovdqa xmm0, xmmword ptr [rdi + 128]
vinserti128 ymm4, ymm0, xmmword ptr [rdi + 144], 1
vmovdqa xmm0, xmmword ptr [rdi + 160]
vinserti128 ymm3, ymm0, xmmword ptr [rdi + 176], 1
vpsrld ymm0, ymm4, 6
vpslld ymm1, ymm4, 26
vpor ymm0, ymm1, ymm0
vpsrld ymm1, ymm4, 11
vpslld ymm2, ymm4, 21
vpor ymm1, ymm2, ymm1
vpxor ymm0, ymm1, ymm0
vpsrld ymm1, ymm4, 25
vpslld ymm2, ymm4, 7
vpor ymm1, ymm2, ymm1
vmovdqa xmm2, xmmword ptr [rdi + 192]
vinserti128 ymm5, ymm2, xmmword ptr [rdi + 208], 1
vpxor ymm0, ymm0, ymm1
vpand ymm1, ymm3, ymm4
vmovdqa ymm7, ymm3
vpandn ymm2, ymm4, ymm5
vmovdqa ymm6, ymm5
vmovdqa ymmword ptr [rsp + 800], ymm6 ## 32-byte Spill
vpxor ymm1, ymm2, ymm1
vmovdqa xmm2, xmmword ptr [rdi + 224]
vinserti128 ymm2, ymm2, xmmword ptr [rdi + 240], 1
vmovdqa ymmword ptr [rsp + 864], ymm2 ## 32-byte Spill
vpaddd ymm2, ymm9, ymm2
vpaddd ymm1, ymm2, ymm1
vpbroadcastd ymm2, dword ptr [rip + LCPI2_1] ## ymm2 = [1116352408,1116352408,1116352408,1116352408,1116352408,1116352408,1116352408,1116352408]
vpaddd ymm1, ymm1, ymm2
vpaddd ymm1, ymm0, ymm1
vmovdqa xmm0, xmmword ptr [rdi]
vinserti128 ymm5, ymm0, xmmword ptr [rdi + 16], 1
vpsrld ymm0, ymm5, 2
vpslld ymm2, ymm5, 30
vpor ymm0, ymm2, ymm0
vpsrld ymm2, ymm5, 13
vpslld ymm3, ymm5, 19
vpor ymm2, ymm3, ymm2
vpxor ymm0, ymm2, ymm0
vpsrld ymm2, ymm5, 22
vpslld ymm3, ymm5, 10
vpor ymm2, ymm3, ymm2
vpxor ymm0, ymm0, ymm2
vmovdqa xmm2, xmmword ptr [rdi + 32]
vinserti128 ymm9, ymm2, xmmword ptr [rdi + 48], 1
vmovdqa xmm2, xmmword ptr [rdi + 64]
vinserti128 ymm8, ymm2, xmmword ptr [rdi + 80], 1
vpxor ymm2, ymm8, ymm9
vpand ymm2, ymm2, ymm5
vmovdqa ymm13, ymm5
vpand ymm3, ymm8, ymm9
vmovdqa ymm10, ymm9
vmovdqa ymmword ptr [rsp + 768], ymm8 ## 32-byte Spill
vpxor ymm2, ymm2, ymm3
vpaddd ymm0, ymm0, ymm2
vmovdqa xmm2, xmmword ptr [rdi + 96]
vinserti128 ymm2, ymm2, xmmword ptr [rdi + 112], 1
vmovdqa ymmword ptr [rsp + 832], ymm2 ## 32-byte Spill
vpaddd ymm0, ymm0, ymm1
vpaddd ymm5, ymm1, ymm2
vpsrld ymm1, ymm5, 6
vpslld ymm2, ymm5, 26
vpor ymm1, ymm2, ymm1
vpsrld ymm2, ymm5, 11
vpslld ymm3, ymm5, 21
vpor ymm2, ymm3, ymm2
vpxor ymm1, ymm2, ymm1
vpsrld ymm2, ymm5, 25
vpslld ymm3, ymm5, 7
vpor ymm2, ymm3, ymm2
vpxor ymm1, ymm1, ymm2
vpand ymm2, ymm4, ymm5
vmovdqa ymm12, ymm4
vpandn ymm3, ymm5, ymm7
vmovdqa ymm9, ymm7
vmovdqa ymmword ptr [rsp + 736], ymm9 ## 32-byte Spill
vpxor ymm2, ymm3, ymm2
vmovdqa ymm3, ymmword ptr [rsp + 928]
vmovdqa ymmword ptr [rsp + 288], ymm3 ## 32-byte Spill
vpaddd ymm3, ymm6, ymm3
vpaddd ymm2, ymm3, ymm2
vpbroadcastd ymm3, dword ptr [rip + LCPI2_2] ## ymm3 = [1899447441,1899447441,1899447441,1899447441,1899447441,1899447441,1899447441,1899447441]
vpaddd ymm2, ymm2, ymm3
vpaddd ymm2, ymm1, ymm2
vpsrld ymm1, ymm0, 2
vpslld ymm3, ymm0, 30
vpor ymm1, ymm3, ymm1
vpsrld ymm3, ymm0, 13
vpslld ymm4, ymm0, 19
vpor ymm3, ymm4, ymm3
vpxor ymm1, ymm3, ymm1
vpsrld ymm3, ymm0, 22
vpslld ymm4, ymm0, 10
vpor ymm3, ymm4, ymm3
vpxor ymm1, ymm1, ymm3
vpand ymm3, ymm10, ymm13
vpand ymm4, ymm13, ymm0
vmovdqa ymm14, ymm13
vpxor ymm3, ymm4, ymm3
vpand ymm4, ymm10, ymm0
vmovdqa ymm13, ymm10
vmovdqa ymmword ptr [rsp + 704], ymm13 ## 32-byte Spill
vpxor ymm3, ymm3, ymm4
vpaddd ymm1, ymm1, ymm3
vpaddd ymm1, ymm1, ymm2
vpaddd ymm7, ymm2, ymm8
vpsrld ymm2, ymm7, 6
vpslld ymm3, ymm7, 26
vpor ymm2, ymm3, ymm2
vpsrld ymm3, ymm7, 11
vpslld ymm4, ymm7, 21
vpor ymm3, ymm4, ymm3
vpxor ymm2, ymm3, ymm2
vpsrld ymm3, ymm7, 25
vpslld ymm4, ymm7, 7
vpor ymm3, ymm4, ymm3
vpxor ymm2, ymm2, ymm3
vpand ymm3, ymm7, ymm5
vmovdqa ymm10, ymm12
vmovdqa ymmword ptr [rsp + 672], ymm10 ## 32-byte Spill
vpandn ymm4, ymm7, ymm10
vpxor ymm3, ymm3, ymm4
vmovdqa ymm4, ymmword ptr [rsp + 960]
vmovdqa ymmword ptr [rsp + 96], ymm4 ## 32-byte Spill
vpaddd ymm4, ymm9, ymm4
vpaddd ymm3, ymm4, ymm3
vpbroadcastd ymm4, dword ptr [rip + LCPI2_3] ## ymm4 = [3049323471,3049323471,3049323471,3049323471,3049323471,3049323471,3049323471,3049323471]
vpaddd ymm3, ymm3, ymm4
vpaddd ymm3, ymm2, ymm3
vpsrld ymm2, ymm1, 2
vpslld ymm4, ymm1, 30
vpor ymm2, ymm4, ymm2
vpsrld ymm4, ymm1, 13
vpslld ymm6, ymm1, 19
vpor ymm4, ymm6, ymm4
vpxor ymm2, ymm4, ymm2
vpsrld ymm4, ymm1, 22
vpslld ymm6, ymm1, 10
vpor ymm4, ymm6, ymm4
vpxor ymm2, ymm2, ymm4
vpxor ymm4, ymm14, ymm1
vpand ymm4, ymm4, ymm0
vpand ymm6, ymm14, ymm1
vmovdqa ymmword ptr [rsp + 640], ymm14 ## 32-byte Spill
vpxor ymm4, ymm4, ymm6
vpaddd ymm2, ymm2, ymm4
vpaddd ymm2, ymm2, ymm3
vpaddd ymm8, ymm3, ymm13
vpsrld ymm3, ymm8, 6
vpslld ymm4, ymm8, 26
vpor ymm3, ymm4, ymm3
vpsrld ymm4, ymm8, 11
vpslld ymm6, ymm8, 21
vpor ymm4, ymm6, ymm4
vpxor ymm3, ymm4, ymm3
vpsrld ymm4, ymm8, 25
vpslld ymm6, ymm8, 7
vpor ymm4, ymm6, ymm4
vpxor ymm3, ymm3, ymm4
vpand ymm4, ymm8, ymm7
vpandn ymm6, ymm8, ymm5
vpxor ymm4, ymm4, ymm6
vmovdqa ymm6, ymmword ptr [rsp + 992]
vmovdqa ymmword ptr [rsp + 448], ymm6 ## 32-byte Spill
vpaddd ymm6, ymm10, ymm6
vpaddd ymm4, ymm6, ymm4
vpbroadcastd ymm6, dword ptr [rip + LCPI2_4] ## ymm6 = [3921009573,3921009573,3921009573,3921009573,3921009573,3921009573,3921009573,3921009573]
vpaddd ymm4, ymm4, ymm6
vpaddd ymm3, ymm3, ymm4
vpsrld ymm4, ymm2, 2
vpslld ymm6, ymm2, 30
vpor ymm4, ymm6, ymm4
vpsrld ymm6, ymm2, 13
vpslld ymm9, ymm2, 19
vpor ymm6, ymm9, ymm6
vpxor ymm4, ymm6, ymm4
vpsrld ymm6, ymm2, 22
vpslld ymm9, ymm2, 10
vpor ymm6, ymm9, ymm6
vpxor ymm4, ymm4, ymm6
vpand ymm9, ymm1, ymm0
vpand ymm6, ymm2, ymm1
vpxor ymm9, ymm6, ymm9
vpand ymm10, ymm2, ymm0
vpxor ymm9, ymm9, ymm10
vpaddd ymm4, ymm4, ymm9
vpaddd ymm4, ymm4, ymm3
vpaddd ymm10, ymm3, ymm14
vpsrld ymm3, ymm10, 6
vpslld ymm9, ymm10, 26
vpor ymm3, ymm9, ymm3
vpsrld ymm9, ymm10, 11
vpslld ymm14, ymm10, 21
vpor ymm9, ymm14, ymm9
vpxor ymm3, ymm9, ymm3
vpsrld ymm9, ymm10, 25
vpslld ymm14, ymm10, 7
vpor ymm9, ymm14, ymm9
vpxor ymm3, ymm3, ymm9
vpand ymm9, ymm10, ymm8
vpandn ymm14, ymm10, ymm7
vpxor ymm9, ymm9, ymm14
vmovdqa ymm12, ymmword ptr [rsp + 1024]
vmovdqa ymmword ptr [rsp + 64], ymm12 ## 32-byte Spill
vpaddd ymm5, ymm12, ymm5
vpaddd ymm5, ymm5, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_5] ## ymm9 = [961987163,961987163,961987163,961987163,961987163,961987163,961987163,961987163]
vpaddd ymm5, ymm5, ymm9
vpaddd ymm9, ymm3, ymm5
vpsrld ymm3, ymm4, 2
vpslld ymm5, ymm4, 30
vpor ymm3, ymm5, ymm3
vpsrld ymm5, ymm4, 13
vpslld ymm15, ymm4, 19
vpor ymm5, ymm15, ymm5
vpxor ymm3, ymm5, ymm3
vpsrld ymm5, ymm4, 22
vpslld ymm15, ymm4, 10
vpor ymm5, ymm15, ymm5
vpxor ymm5, ymm3, ymm5
vpand ymm3, ymm4, ymm2
vpxor ymm6, ymm3, ymm6
vpand ymm15, ymm4, ymm1
vpxor ymm6, ymm6, ymm15
vpaddd ymm6, ymm5, ymm6
vpaddd ymm5, ymm9, ymm0
vpaddd ymm0, ymm6, ymm9
vpsrld ymm6, ymm5, 6
vpslld ymm9, ymm5, 26
vpor ymm6, ymm9, ymm6
vpsrld ymm9, ymm5, 11
vpslld ymm15, ymm5, 21
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm9, ymm6
vpsrld ymm9, ymm5, 25
vpslld ymm15, ymm5, 7
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm6, ymm9
vpand ymm9, ymm5, ymm10
vpandn ymm15, ymm5, ymm8
vpxor ymm9, ymm9, ymm15
vmovdqa ymm12, ymmword ptr [rsp + 1056]
vmovdqa ymmword ptr [rsp + 416], ymm12 ## 32-byte Spill
vpaddd ymm7, ymm12, ymm7
vpaddd ymm7, ymm7, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_6] ## ymm9 = [1508970993,1508970993,1508970993,1508970993,1508970993,1508970993,1508970993,1508970993]
vpaddd ymm7, ymm7, ymm9
vpaddd ymm9, ymm6, ymm7
vpsrld ymm6, ymm0, 2
vpslld ymm7, ymm0, 30
vpor ymm6, ymm7, ymm6
vpsrld ymm7, ymm0, 13
vpslld ymm15, ymm0, 19
vpor ymm7, ymm15, ymm7
vpxor ymm6, ymm7, ymm6
vpsrld ymm7, ymm0, 22
vpslld ymm15, ymm0, 10
vpor ymm7, ymm15, ymm7
vpxor ymm7, ymm6, ymm7
vpand ymm6, ymm0, ymm4
vpxor ymm3, ymm6, ymm3
vpand ymm15, ymm0, ymm2
vpxor ymm3, ymm3, ymm15
vpaddd ymm3, ymm7, ymm3
vpaddd ymm7, ymm9, ymm1
vpaddd ymm1, ymm3, ymm9
vpsrld ymm3, ymm7, 6
vpslld ymm9, ymm7, 26
vpor ymm3, ymm9, ymm3
vpsrld ymm9, ymm7, 11
vpslld ymm15, ymm7, 21
vpor ymm9, ymm15, ymm9
vpxor ymm3, ymm9, ymm3
vpsrld ymm9, ymm7, 25
vpslld ymm15, ymm7, 7
vpor ymm9, ymm15, ymm9
vpxor ymm3, ymm3, ymm9
vpand ymm9, ymm7, ymm5
vpandn ymm15, ymm7, ymm10
vpxor ymm9, ymm9, ymm15
vpaddd ymm8, ymm11, ymm8
vpaddd ymm8, ymm8, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_7] ## ymm9 = [2453635748,2453635748,2453635748,2453635748,2453635748,2453635748,2453635748,2453635748]
vpaddd ymm8, ymm8, ymm9
vpaddd ymm9, ymm3, ymm8
vpsrld ymm3, ymm1, 2
vpslld ymm8, ymm1, 30
vpor ymm3, ymm8, ymm3
vpsrld ymm8, ymm1, 13
vpslld ymm15, ymm1, 19
vpor ymm8, ymm15, ymm8
vpxor ymm3, ymm8, ymm3
vpsrld ymm8, ymm1, 22
vpslld ymm15, ymm1, 10
vpor ymm8, ymm15, ymm8
vpxor ymm8, ymm3, ymm8
vpand ymm3, ymm1, ymm0
vpxor ymm6, ymm3, ymm6
vpand ymm15, ymm1, ymm4
vpxor ymm6, ymm6, ymm15
vpaddd ymm6, ymm8, ymm6
vpaddd ymm8, ymm9, ymm2
vpaddd ymm2, ymm6, ymm9
vpsrld ymm6, ymm8, 6
vpslld ymm9, ymm8, 26
vpor ymm6, ymm9, ymm6
vpsrld ymm9, ymm8, 11
vpslld ymm15, ymm8, 21
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm9, ymm6
vpsrld ymm9, ymm8, 25
vpslld ymm15, ymm8, 7
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm6, ymm9
vpand ymm9, ymm8, ymm7
vpandn ymm15, ymm8, ymm5
vpxor ymm9, ymm9, ymm15
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm9, ymm10, ymm9
vpbroadcastd ymm10, dword ptr [rip + LCPI2_8] ## ymm10 = [2870763221,2870763221,2870763221,2870763221,2870763221,2870763221,2870763221,2870763221]
vpaddd ymm9, ymm9, ymm10
vpaddd ymm9, ymm6, ymm9
vpsrld ymm6, ymm2, 2
vpslld ymm10, ymm2, 30
vpor ymm6, ymm10, ymm6
vpsrld ymm10, ymm2, 13
vpslld ymm15, ymm2, 19
vpor ymm10, ymm15, ymm10
vpxor ymm6, ymm10, ymm6
vpsrld ymm10, ymm2, 22
vpslld ymm15, ymm2, 10
vpor ymm10, ymm15, ymm10
vpxor ymm10, ymm6, ymm10
vpand ymm6, ymm2, ymm1
vpxor ymm3, ymm6, ymm3
vpand ymm15, ymm2, ymm0
vpxor ymm3, ymm3, ymm15
vpaddd ymm3, ymm10, ymm3
vpaddd ymm10, ymm9, ymm4
vpaddd ymm4, ymm3, ymm9
vpsrld ymm3, ymm10, 6
vpslld ymm9, ymm10, 26
vpor ymm3, ymm9, ymm3
vpsrld ymm9, ymm10, 11
vpslld ymm15, ymm10, 21
vpor ymm9, ymm15, ymm9
vpxor ymm3, ymm9, ymm3
vpsrld ymm9, ymm10, 25
vpslld ymm15, ymm10, 7
vpor ymm9, ymm15, ymm9
vpxor ymm3, ymm3, ymm9
vpand ymm9, ymm10, ymm8
vpandn ymm15, ymm10, ymm7
vpxor ymm9, ymm9, ymm15
vpaddd ymm5, ymm5, ymmword ptr [rsp + 352] ## 32-byte Folded Reload
vpaddd ymm5, ymm5, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_9] ## ymm9 = [3624381080,3624381080,3624381080,3624381080,3624381080,3624381080,3624381080,3624381080]
vpaddd ymm5, ymm5, ymm9
vpaddd ymm3, ymm3, ymm5
vpsrld ymm5, ymm4, 2
vpslld ymm9, ymm4, 30
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm4, 13
vpslld ymm15, ymm4, 19
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm4, 22
vpslld ymm15, ymm4, 10
vpor ymm9, ymm15, ymm9
vpxor ymm9, ymm5, ymm9
vpand ymm5, ymm4, ymm2
vpxor ymm6, ymm5, ymm6
vpand ymm15, ymm4, ymm1
vpxor ymm6, ymm6, ymm15
vpaddd ymm6, ymm9, ymm6
vpaddd ymm0, ymm3, ymm0
vpaddd ymm3, ymm6, ymm3
vpsrld ymm6, ymm0, 6
vpslld ymm9, ymm0, 26
vpor ymm6, ymm9, ymm6
vpsrld ymm9, ymm0, 11
vpslld ymm15, ymm0, 21
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm9, ymm6
vpsrld ymm9, ymm0, 25
vpslld ymm15, ymm0, 7
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm6, ymm9
vpand ymm9, ymm0, ymm10
vpandn ymm15, ymm0, ymm8
vpxor ymm9, ymm9, ymm15
vpaddd ymm7, ymm7, ymmword ptr [rsp + 224] ## 32-byte Folded Reload
vpaddd ymm7, ymm7, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_10] ## ymm9 = [310598401,310598401,310598401,310598401,310598401,310598401,310598401,310598401]
vpaddd ymm7, ymm7, ymm9
vpaddd ymm6, ymm6, ymm7
vpsrld ymm7, ymm3, 2
vpslld ymm9, ymm3, 30
vpor ymm7, ymm9, ymm7
vpsrld ymm9, ymm3, 13
vpslld ymm15, ymm3, 19
vpor ymm9, ymm15, ymm9
vpxor ymm7, ymm9, ymm7
vpsrld ymm9, ymm3, 22
vpslld ymm15, ymm3, 10
vpor ymm9, ymm15, ymm9
vpxor ymm9, ymm7, ymm9
vpand ymm7, ymm3, ymm4
vpxor ymm5, ymm7, ymm5
vpand ymm15, ymm3, ymm2
vpxor ymm5, ymm5, ymm15
vpaddd ymm5, ymm9, ymm5
vpaddd ymm1, ymm6, ymm1
vpaddd ymm6, ymm5, ymm6
vpsrld ymm5, ymm1, 6
vpslld ymm9, ymm1, 26
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm1, 11
vpslld ymm15, ymm1, 21
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm1, 25
vpslld ymm15, ymm1, 7
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm5, ymm9
vpand ymm9, ymm1, ymm0
vpandn ymm15, ymm1, ymm10
vpxor ymm9, ymm9, ymm15
vpaddd ymm8, ymm8, ymmword ptr [rsp + 128] ## 32-byte Folded Reload
vpaddd ymm8, ymm8, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_11] ## ymm9 = [607225278,607225278,607225278,607225278,607225278,607225278,607225278,607225278]
vpaddd ymm8, ymm8, ymm9
vpaddd ymm5, ymm5, ymm8
vpsrld ymm8, ymm6, 2
vpslld ymm9, ymm6, 30
vpor ymm8, ymm9, ymm8
vpsrld ymm9, ymm6, 13
vpslld ymm15, ymm6, 19
vpor ymm9, ymm15, ymm9
vpxor ymm8, ymm9, ymm8
vpsrld ymm9, ymm6, 22
vpslld ymm15, ymm6, 10
vpor ymm9, ymm15, ymm9
vpxor ymm9, ymm8, ymm9
vpand ymm8, ymm6, ymm3
vpxor ymm7, ymm8, ymm7
vpand ymm15, ymm6, ymm4
vpxor ymm7, ymm7, ymm15
vpaddd ymm7, ymm9, ymm7
vpaddd ymm2, ymm5, ymm2
vpaddd ymm5, ymm7, ymm5
vpsrld ymm7, ymm2, 6
vpslld ymm9, ymm2, 26
vpor ymm7, ymm9, ymm7
vpsrld ymm9, ymm2, 11
vpslld ymm15, ymm2, 21
vpor ymm9, ymm15, ymm9
vpxor ymm7, ymm9, ymm7
vpsrld ymm9, ymm2, 25
vpslld ymm15, ymm2, 7
vpor ymm9, ymm15, ymm9
vpxor ymm7, ymm7, ymm9
vpand ymm9, ymm2, ymm1
vpandn ymm15, ymm2, ymm0
vpxor ymm9, ymm9, ymm15
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload
vpaddd ymm9, ymm10, ymm9
vpbroadcastd ymm10, dword ptr [rip + LCPI2_12] ## ymm10 = [1426881987,1426881987,1426881987,1426881987,1426881987,1426881987,1426881987,1426881987]
vpaddd ymm9, ymm9, ymm10
vpaddd ymm7, ymm7, ymm9
vpsrld ymm9, ymm5, 2
vpslld ymm10, ymm5, 30
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm5, 13
vpslld ymm15, ymm5, 19
vpor ymm10, ymm15, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm5, 22
vpslld ymm15, ymm5, 10
vpor ymm10, ymm15, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm5, ymm6
vpxor ymm8, ymm10, ymm8
vpand ymm15, ymm5, ymm3
vpxor ymm8, ymm8, ymm15
vpaddd ymm8, ymm9, ymm8
vpaddd ymm4, ymm7, ymm4
vpaddd ymm7, ymm8, ymm7
vpsrld ymm8, ymm4, 6
vpslld ymm9, ymm4, 26
vpor ymm8, ymm9, ymm8
vpsrld ymm9, ymm4, 11
vpslld ymm15, ymm4, 21
vpor ymm9, ymm15, ymm9
vpxor ymm8, ymm9, ymm8
vpsrld ymm9, ymm4, 25
vpslld ymm15, ymm4, 7
vpor ymm9, ymm15, ymm9
vpxor ymm8, ymm8, ymm9
vpand ymm9, ymm4, ymm2
vpandn ymm15, ymm4, ymm1
vpxor ymm9, ymm9, ymm15
vpaddd ymm0, ymm0, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm0, ymm0, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_13] ## ymm9 = [1925078388,1925078388,1925078388,1925078388,1925078388,1925078388,1925078388,1925078388]
vpaddd ymm0, ymm0, ymm9
vpaddd ymm9, ymm8, ymm0
vpsrld ymm0, ymm7, 2
vpslld ymm8, ymm7, 30
vpor ymm0, ymm8, ymm0
vpsrld ymm8, ymm7, 13
vpslld ymm15, ymm7, 19
vpor ymm8, ymm15, ymm8
vpxor ymm0, ymm8, ymm0
vpsrld ymm8, ymm7, 22
vpslld ymm15, ymm7, 10
vpor ymm8, ymm15, ymm8
vpxor ymm8, ymm0, ymm8
vpand ymm0, ymm7, ymm5
vpxor ymm10, ymm0, ymm10
vpand ymm15, ymm7, ymm6
vpxor ymm10, ymm10, ymm15
vpaddd ymm10, ymm8, ymm10
vpaddd ymm8, ymm9, ymm3
vpaddd ymm3, ymm10, ymm9
vpsrld ymm9, ymm8, 6
vpslld ymm10, ymm8, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm8, 11
vpslld ymm15, ymm8, 21
vpor ymm10, ymm15, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm8, 25
vpslld ymm15, ymm8, 7
vpor ymm10, ymm15, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm8, ymm4
vpandn ymm15, ymm8, ymm2
vpxor ymm10, ymm10, ymm15
vpaddd ymm1, ymm1, ymmword ptr [rsp + 480] ## 32-byte Folded Reload
vpaddd ymm1, ymm1, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_14] ## ymm10 = [2162078206,2162078206,2162078206,2162078206,2162078206,2162078206,2162078206,2162078206]
vpaddd ymm1, ymm1, ymm10
vpaddd ymm9, ymm9, ymm1
vpsrld ymm1, ymm3, 2
vpslld ymm10, ymm3, 30
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm3, 13
vpslld ymm15, ymm3, 19
vpor ymm10, ymm15, ymm10
vpxor ymm1, ymm10, ymm1
vpsrld ymm10, ymm3, 22
vpslld ymm15, ymm3, 10
vpor ymm10, ymm15, ymm10
vpxor ymm10, ymm1, ymm10
vpand ymm1, ymm3, ymm7
vpxor ymm0, ymm1, ymm0
vpand ymm15, ymm3, ymm5
vpxor ymm0, ymm0, ymm15
vpaddd ymm10, ymm10, ymm0
vpaddd ymm0, ymm9, ymm6
vpaddd ymm10, ymm10, ymm9
vpsrld ymm6, ymm0, 6
vpslld ymm9, ymm0, 26
vpor ymm6, ymm9, ymm6
vpsrld ymm9, ymm0, 11
vpslld ymm15, ymm0, 21
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm9, ymm6
vpsrld ymm9, ymm0, 25
vpslld ymm15, ymm0, 7
vpor ymm9, ymm15, ymm9
vpxor ymm6, ymm6, ymm9
vpand ymm9, ymm0, ymm8
vpandn ymm15, ymm0, ymm4
vpxor ymm9, ymm9, ymm15
vmovdqa ymm12, ymmword ptr [rsp + 320] ## 32-byte Reload
vpaddd ymm2, ymm12, ymm2
vpaddd ymm2, ymm2, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_15] ## ymm9 = [2614888103,2614888103,2614888103,2614888103,2614888103,2614888103,2614888103,2614888103]
vpaddd ymm2, ymm2, ymm9
vpaddd ymm6, ymm6, ymm2
vpsrld ymm2, ymm10, 2
vpslld ymm9, ymm10, 30
vpor ymm2, ymm9, ymm2
vpsrld ymm9, ymm10, 13
vpslld ymm15, ymm10, 19
vpor ymm9, ymm15, ymm9
vpxor ymm2, ymm9, ymm2
vpsrld ymm9, ymm10, 22
vpslld ymm15, ymm10, 10
vpor ymm9, ymm15, ymm9
vpxor ymm9, ymm2, ymm9
vpand ymm2, ymm10, ymm3
vpxor ymm1, ymm2, ymm1
vpand ymm15, ymm10, ymm7
vpxor ymm1, ymm1, ymm15
vpaddd ymm9, ymm9, ymm1
vpaddd ymm1, ymm6, ymm5
vpaddd ymm6, ymm9, ymm6
vpsrld ymm5, ymm1, 6
vpslld ymm9, ymm1, 26
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm1, 11
vpslld ymm15, ymm1, 21
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm1, 25
vpslld ymm15, ymm1, 7
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm5, ymm9
vpand ymm9, ymm1, ymm0
vpandn ymm15, ymm1, ymm8
vpxor ymm9, ymm9, ymm15
vmovdqa ymm11, ymmword ptr [rsp + 256] ## 32-byte Reload
vpaddd ymm4, ymm11, ymm4
vpaddd ymm4, ymm4, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_16] ## ymm9 = [3248222580,3248222580,3248222580,3248222580,3248222580,3248222580,3248222580,3248222580]
vpaddd ymm4, ymm4, ymm9
vpaddd ymm4, ymm5, ymm4
vpsrld ymm5, ymm6, 2
vpslld ymm9, ymm6, 30
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm6, 13
vpslld ymm15, ymm6, 19
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm6, 22
vpslld ymm15, ymm6, 10
vpor ymm9, ymm15, ymm9
vpxor ymm5, ymm5, ymm9
vpand ymm9, ymm6, ymm10
vpxor ymm2, ymm9, ymm2
vpand ymm15, ymm6, ymm3
vpxor ymm2, ymm2, ymm15
vpaddd ymm2, ymm5, ymm2
vpaddd ymm5, ymm4, ymm7
vpaddd ymm7, ymm2, ymm4
vpsrld ymm2, ymm12, 17
vpslld ymm4, ymm12, 15
vpor ymm2, ymm4, ymm2
vpsrld ymm4, ymm12, 19
vpslld ymm15, ymm12, 13
vpor ymm4, ymm15, ymm4
vpsrld ymm15, ymm12, 10
vpxor ymm2, ymm2, ymm15
vpxor ymm2, ymm2, ymm4
vmovdqa ymm13, ymmword ptr [rsp + 288] ## 32-byte Reload
vpsrld ymm4, ymm13, 7
vpslld ymm15, ymm13, 25
vpor ymm4, ymm15, ymm4
vpsrld ymm15, ymm13, 18
vpslld ymm14, ymm13, 14
vpor ymm14, ymm14, ymm15
vpsrld ymm15, ymm13, 3
vpxor ymm4, ymm4, ymm15
vpxor ymm4, ymm4, ymm14
vmovdqa ymm12, ymmword ptr [rsp + 224] ## 32-byte Reload
vpaddd ymm14, ymm12, ymmword ptr [rsp + 192] ## 32-byte Folded Reload
vpaddd ymm4, ymm4, ymm14
vpaddd ymm12, ymm4, ymm2
vpsrld ymm2, ymm5, 6
vpslld ymm4, ymm5, 26
vpor ymm2, ymm4, ymm2
vpsrld ymm4, ymm5, 11
vpslld ymm14, ymm5, 21
vpor ymm4, ymm14, ymm4
vpxor ymm2, ymm4, ymm2
vpsrld ymm4, ymm5, 25
vpslld ymm14, ymm5, 7
vpor ymm4, ymm14, ymm4
vpxor ymm2, ymm2, ymm4
vpand ymm4, ymm5, ymm1
vpandn ymm14, ymm5, ymm0
vpxor ymm4, ymm4, ymm14
vpaddd ymm8, ymm12, ymm8
vpaddd ymm4, ymm8, ymm4
vpbroadcastd ymm8, dword ptr [rip + LCPI2_17] ## ymm8 = [3835390401,3835390401,3835390401,3835390401,3835390401,3835390401,3835390401,3835390401]
vpaddd ymm4, ymm4, ymm8
vpaddd ymm8, ymm2, ymm4
vpsrld ymm2, ymm7, 2
vpslld ymm4, ymm7, 30
vpor ymm2, ymm4, ymm2
vpsrld ymm4, ymm7, 13
vpslld ymm14, ymm7, 19
vpor ymm4, ymm14, ymm4
vpxor ymm2, ymm4, ymm2
vpsrld ymm4, ymm7, 22
vpslld ymm14, ymm7, 10
vpor ymm4, ymm14, ymm4
vpxor ymm2, ymm2, ymm4
vpand ymm4, ymm7, ymm6
vpxor ymm9, ymm4, ymm9
vpand ymm14, ymm7, ymm10
vpxor ymm9, ymm9, ymm14
vpaddd ymm9, ymm2, ymm9
vpaddd ymm2, ymm8, ymm3
vpaddd ymm8, ymm9, ymm8
vpsrld ymm3, ymm11, 17
vpslld ymm9, ymm11, 15
vpor ymm3, ymm9, ymm3
vpsrld ymm9, ymm11, 19
vpslld ymm14, ymm11, 13
vpor ymm9, ymm14, ymm9
vpsrld ymm14, ymm11, 10
vpxor ymm3, ymm3, ymm14
vpxor ymm3, ymm3, ymm9
vmovdqa ymm11, ymmword ptr [rsp + 96] ## 32-byte Reload
vpsrld ymm9, ymm11, 7
vpslld ymm14, ymm11, 25
vpor ymm9, ymm14, ymm9
vpsrld ymm14, ymm11, 18
vpslld ymm15, ymm11, 14
vpor ymm14, ymm15, ymm14
vpsrld ymm15, ymm11, 3
vpxor ymm9, ymm9, ymm15
vpxor ymm9, ymm9, ymm14
vpaddd ymm11, ymm13, ymmword ptr [rsp + 128] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymm11
vpaddd ymm15, ymm9, ymm3
vpsrld ymm3, ymm2, 6
vpslld ymm9, ymm2, 26
vpor ymm3, ymm9, ymm3
vpsrld ymm9, ymm2, 11
vpslld ymm11, ymm2, 21
vpor ymm9, ymm11, ymm9
vpxor ymm3, ymm9, ymm3
vpsrld ymm9, ymm2, 25
vpslld ymm11, ymm2, 7
vpor ymm9, ymm11, ymm9
vpxor ymm3, ymm3, ymm9
vpand ymm9, ymm2, ymm5
vpandn ymm11, ymm2, ymm1
vpxor ymm9, ymm9, ymm11
vpaddd ymm0, ymm15, ymm0
vpaddd ymm0, ymm0, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_18] ## ymm9 = [4022224774,4022224774,4022224774,4022224774,4022224774,4022224774,4022224774,4022224774]
vpaddd ymm0, ymm0, ymm9
vpaddd ymm9, ymm3, ymm0
vpsrld ymm0, ymm8, 2
vpslld ymm3, ymm8, 30
vpor ymm0, ymm3, ymm0
vpsrld ymm3, ymm8, 13
vpslld ymm11, ymm8, 19
vpor ymm3, ymm11, ymm3
vpxor ymm0, ymm3, ymm0
vpsrld ymm3, ymm8, 22
vpslld ymm11, ymm8, 10
vpor ymm3, ymm11, ymm3
vpxor ymm3, ymm0, ymm3
vpand ymm0, ymm8, ymm7
vpxor ymm4, ymm0, ymm4
vpand ymm11, ymm8, ymm6
vpxor ymm4, ymm4, ymm11
vpaddd ymm4, ymm3, ymm4
vpaddd ymm3, ymm9, ymm10
vpaddd ymm10, ymm4, ymm9
vmovdqa ymmword ptr [rsp + 192], ymm12 ## 32-byte Spill
vpsrld ymm4, ymm12, 17
vpslld ymm9, ymm12, 15
vpor ymm4, ymm9, ymm4
vpsrld ymm9, ymm12, 19
vpslld ymm11, ymm12, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm12, 10
vpxor ymm4, ymm4, ymm11
vpxor ymm4, ymm4, ymm9
vmovdqa ymm12, ymmword ptr [rsp + 448] ## 32-byte Reload
vpsrld ymm9, ymm12, 7
vpslld ymm11, ymm12, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm12, 18
vpslld ymm14, ymm12, 14
vpor ymm11, ymm14, ymm11
vpsrld ymm14, ymm12, 3
vmovdqa ymm13, ymm12
vpxor ymm9, ymm9, ymm14
vpxor ymm9, ymm9, ymm11
vmovdqa ymm11, ymmword ptr [rsp + 96] ## 32-byte Reload
vpaddd ymm11, ymm11, ymmword ptr [rsp + 160] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymm11
vpaddd ymm14, ymm9, ymm4
vpsrld ymm4, ymm3, 6
vpslld ymm9, ymm3, 26
vpor ymm4, ymm9, ymm4
vpsrld ymm9, ymm3, 11
vpslld ymm11, ymm3, 21
vpor ymm9, ymm11, ymm9
vpxor ymm4, ymm9, ymm4
vpsrld ymm9, ymm3, 25
vpslld ymm11, ymm3, 7
vpor ymm9, ymm11, ymm9
vpxor ymm4, ymm4, ymm9
vpand ymm9, ymm3, ymm2
vpandn ymm11, ymm3, ymm5
vpxor ymm9, ymm9, ymm11
vpaddd ymm1, ymm14, ymm1
vpaddd ymm1, ymm1, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_19] ## ymm9 = [264347078,264347078,264347078,264347078,264347078,264347078,264347078,264347078]
vpaddd ymm1, ymm1, ymm9
vpaddd ymm4, ymm4, ymm1
vpsrld ymm1, ymm10, 2
vpslld ymm9, ymm10, 30
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm10, 13
vpslld ymm11, ymm10, 19
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm9, ymm1
vpsrld ymm9, ymm10, 22
vpslld ymm11, ymm10, 10
vpor ymm9, ymm11, ymm9
vpxor ymm9, ymm1, ymm9
vpand ymm1, ymm10, ymm8
vpxor ymm0, ymm1, ymm0
vpand ymm11, ymm10, ymm7
vpxor ymm0, ymm0, ymm11
vpaddd ymm9, ymm9, ymm0
vpaddd ymm0, ymm4, ymm6
vpaddd ymm6, ymm9, ymm4
vmovdqa ymmword ptr [rsp + 288], ymm15 ## 32-byte Spill
vpsrld ymm4, ymm15, 17
vpslld ymm9, ymm15, 15
vpor ymm4, ymm9, ymm4
vpsrld ymm9, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm15, 10
vpxor ymm4, ymm4, ymm11
vpxor ymm4, ymm4, ymm9
vmovdqa ymm15, ymmword ptr [rsp + 64] ## 32-byte Reload
vpsrld ymm9, ymm15, 7
vpslld ymm11, ymm15, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm15, 18
vpslld ymm12, ymm15, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm15, 3
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm11, ymm13, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymm11
vpaddd ymm13, ymm9, ymm4
vpsrld ymm4, ymm0, 6
vpslld ymm9, ymm0, 26
vpor ymm4, ymm9, ymm4
vpsrld ymm9, ymm0, 11
vpslld ymm11, ymm0, 21
vpor ymm9, ymm11, ymm9
vpxor ymm4, ymm9, ymm4
vpsrld ymm9, ymm0, 25
vpslld ymm11, ymm0, 7
vpor ymm9, ymm11, ymm9
vpxor ymm4, ymm4, ymm9
vpand ymm9, ymm0, ymm3
vpandn ymm11, ymm0, ymm2
vpxor ymm9, ymm9, ymm11
vpaddd ymm5, ymm13, ymm5
vpaddd ymm5, ymm5, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_20] ## ymm9 = [604807628,604807628,604807628,604807628,604807628,604807628,604807628,604807628]
vpaddd ymm5, ymm5, ymm9
vpaddd ymm4, ymm4, ymm5
vpsrld ymm5, ymm6, 2
vpslld ymm9, ymm6, 30
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm6, 13
vpslld ymm11, ymm6, 19
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm6, 22
vpslld ymm11, ymm6, 10
vpor ymm9, ymm11, ymm9
vpxor ymm9, ymm5, ymm9
vpand ymm5, ymm6, ymm10
vpxor ymm1, ymm5, ymm1
vpand ymm11, ymm6, ymm8
vpxor ymm1, ymm1, ymm11
vpaddd ymm9, ymm9, ymm1
vpaddd ymm1, ymm4, ymm7
vpaddd ymm4, ymm9, ymm4
vmovdqa ymmword ptr [rsp + 96], ymm14 ## 32-byte Spill
vpsrld ymm7, ymm14, 17
vpslld ymm9, ymm14, 15
vpor ymm7, ymm9, ymm7
vpsrld ymm9, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm14, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm9
vmovdqa ymm14, ymmword ptr [rsp + 416] ## 32-byte Reload
vpsrld ymm9, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vmovdqa ymm15, ymm14
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vmovdqa ymm11, ymmword ptr [rsp + 64] ## 32-byte Reload
vpaddd ymm11, ymm11, ymmword ptr [rsp + 480] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymm11
vpaddd ymm14, ymm9, ymm7
vpsrld ymm7, ymm1, 6
vpslld ymm9, ymm1, 26
vpor ymm7, ymm9, ymm7
vpsrld ymm9, ymm1, 11
vpslld ymm11, ymm1, 21
vpor ymm9, ymm11, ymm9
vpxor ymm7, ymm9, ymm7
vpsrld ymm9, ymm1, 25
vpslld ymm11, ymm1, 7
vpor ymm9, ymm11, ymm9
vpxor ymm7, ymm7, ymm9
vpand ymm9, ymm1, ymm0
vpandn ymm11, ymm1, ymm3
vpxor ymm9, ymm9, ymm11
vpaddd ymm2, ymm14, ymm2
vpaddd ymm2, ymm2, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_21] ## ymm9 = [770255983,770255983,770255983,770255983,770255983,770255983,770255983,770255983]
vpaddd ymm2, ymm2, ymm9
vpaddd ymm9, ymm7, ymm2
vpsrld ymm2, ymm4, 2
vpslld ymm7, ymm4, 30
vpor ymm2, ymm7, ymm2
vpsrld ymm7, ymm4, 13
vpslld ymm11, ymm4, 19
vpor ymm7, ymm11, ymm7
vpxor ymm2, ymm7, ymm2
vpsrld ymm7, ymm4, 22
vpslld ymm11, ymm4, 10
vpor ymm7, ymm11, ymm7
vpxor ymm2, ymm2, ymm7
vpand ymm7, ymm4, ymm6
vpxor ymm5, ymm7, ymm5
vpand ymm11, ymm4, ymm10
vpxor ymm5, ymm5, ymm11
vpaddd ymm5, ymm2, ymm5
vpaddd ymm2, ymm9, ymm8
vpaddd ymm8, ymm5, ymm9
vmovdqa ymmword ptr [rsp + 448], ymm13 ## 32-byte Spill
vpsrld ymm5, ymm13, 17
vpslld ymm9, ymm13, 15
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm9
vmovdqa ymm13, ymmword ptr [rsp + 384] ## 32-byte Reload
vpsrld ymm9, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm11, ymm15, ymmword ptr [rsp + 320] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymm11
vpaddd ymm15, ymm9, ymm5
vpsrld ymm5, ymm2, 6
vpslld ymm9, ymm2, 26
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm2, 11
vpslld ymm11, ymm2, 21
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm2, 25
vpslld ymm11, ymm2, 7
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm5, ymm9
vpand ymm9, ymm2, ymm1
vpandn ymm11, ymm2, ymm0
vpxor ymm9, ymm9, ymm11
vpaddd ymm3, ymm15, ymm3
vpaddd ymm3, ymm3, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_22] ## ymm9 = [1249150122,1249150122,1249150122,1249150122,1249150122,1249150122,1249150122,1249150122]
vpaddd ymm3, ymm3, ymm9
vpaddd ymm5, ymm5, ymm3
vpsrld ymm3, ymm8, 2
vpslld ymm9, ymm8, 30
vpor ymm3, ymm9, ymm3
vpsrld ymm9, ymm8, 13
vpslld ymm11, ymm8, 19
vpor ymm9, ymm11, ymm9
vpxor ymm3, ymm9, ymm3
vpsrld ymm9, ymm8, 22
vpslld ymm11, ymm8, 10
vpor ymm9, ymm11, ymm9
vpxor ymm9, ymm3, ymm9
vpand ymm3, ymm8, ymm4
vpxor ymm7, ymm3, ymm7
vpand ymm11, ymm8, ymm6
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm9, ymm7
vpaddd ymm10, ymm5, ymm10
vpaddd ymm9, ymm7, ymm5
vmovdqa ymmword ptr [rsp + 64], ymm14 ## 32-byte Spill
vpsrld ymm5, ymm14, 17
vpslld ymm7, ymm14, 15
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm14, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm7
vmovdqa ymm13, ymmword ptr [rsp] ## 32-byte Reload
vpsrld ymm7, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm7, ymm7, ymm12
vpxor ymm7, ymm7, ymm11
vmovdqa ymm11, ymmword ptr [rsp + 384] ## 32-byte Reload
vpaddd ymm11, ymm11, ymmword ptr [rsp + 256] ## 32-byte Folded Reload
vpaddd ymm7, ymm7, ymm11
vpaddd ymm14, ymm7, ymm5
vpsrld ymm5, ymm10, 6
vpslld ymm7, ymm10, 26
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm10, 11
vpslld ymm11, ymm10, 21
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm7, ymm5
vpsrld ymm7, ymm10, 25
vpslld ymm11, ymm10, 7
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm5, ymm7
vpand ymm7, ymm10, ymm2
vpandn ymm11, ymm10, ymm1
vpxor ymm7, ymm7, ymm11
vpaddd ymm0, ymm14, ymm0
vpaddd ymm0, ymm0, ymm7
vpbroadcastd ymm7, dword ptr [rip + LCPI2_23] ## ymm7 = [1555081692,1555081692,1555081692,1555081692,1555081692,1555081692,1555081692,1555081692]
vpaddd ymm0, ymm0, ymm7
vpaddd ymm5, ymm5, ymm0
vpsrld ymm0, ymm9, 2
vpslld ymm7, ymm9, 30
vpor ymm0, ymm7, ymm0
vpsrld ymm7, ymm9, 13
vpslld ymm11, ymm9, 19
vpor ymm7, ymm11, ymm7
vpxor ymm0, ymm7, ymm0
vpsrld ymm7, ymm9, 22
vpslld ymm11, ymm9, 10
vpor ymm7, ymm11, ymm7
vpxor ymm7, ymm0, ymm7
vpand ymm0, ymm9, ymm8
vpxor ymm3, ymm0, ymm3
vpand ymm11, ymm9, ymm4
vpxor ymm3, ymm3, ymm11
vpaddd ymm3, ymm7, ymm3
vpaddd ymm6, ymm5, ymm6
vpaddd ymm3, ymm3, ymm5
vmovdqa ymmword ptr [rsp + 416], ymm15 ## 32-byte Spill
vpsrld ymm5, ymm15, 17
vpslld ymm7, ymm15, 15
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm15, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm7
vmovdqa ymm13, ymmword ptr [rsp + 352] ## 32-byte Reload
vpsrld ymm7, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm7, ymm7, ymm12
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm7, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm7, ymm7, ymmword ptr [rsp + 192] ## 32-byte Folded Reload
vpaddd ymm15, ymm7, ymm5
vpsrld ymm5, ymm6, 6
vpslld ymm7, ymm6, 26
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm6, 11
vpslld ymm11, ymm6, 21
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm7, ymm5
vpsrld ymm7, ymm6, 25
vpslld ymm11, ymm6, 7
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm5, ymm7
vpand ymm7, ymm6, ymm10
vpandn ymm11, ymm6, ymm2
vpxor ymm7, ymm7, ymm11
vpaddd ymm1, ymm15, ymm1
vpaddd ymm1, ymm1, ymm7
vpbroadcastd ymm7, dword ptr [rip + LCPI2_24] ## ymm7 = [1996064986,1996064986,1996064986,1996064986,1996064986,1996064986,1996064986,1996064986]
vpaddd ymm1, ymm1, ymm7
vpaddd ymm5, ymm5, ymm1
vpsrld ymm1, ymm3, 2
vpslld ymm7, ymm3, 30
vpor ymm1, ymm7, ymm1
vpsrld ymm7, ymm3, 13
vpslld ymm11, ymm3, 19
vpor ymm7, ymm11, ymm7
vpxor ymm1, ymm7, ymm1
vpsrld ymm7, ymm3, 22
vpslld ymm11, ymm3, 10
vpor ymm7, ymm11, ymm7
vpxor ymm7, ymm1, ymm7
vpand ymm1, ymm3, ymm9
vpxor ymm0, ymm1, ymm0
vpand ymm11, ymm3, ymm8
vpxor ymm0, ymm0, ymm11
vpaddd ymm0, ymm7, ymm0
vpaddd ymm4, ymm5, ymm4
vpaddd ymm0, ymm0, ymm5
vmovdqa ymmword ptr [rsp + 384], ymm14 ## 32-byte Spill
vpsrld ymm5, ymm14, 17
vpslld ymm7, ymm14, 15
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm14, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm7
vmovdqa ymm13, ymmword ptr [rsp + 224] ## 32-byte Reload
vpsrld ymm7, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm7, ymm7, ymm12
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm7, ymmword ptr [rsp + 352] ## 32-byte Folded Reload
vpaddd ymm7, ymm7, ymmword ptr [rsp + 288] ## 32-byte Folded Reload
vpaddd ymm14, ymm7, ymm5
vpsrld ymm5, ymm4, 6
vpslld ymm7, ymm4, 26
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm4, 11
vpslld ymm11, ymm4, 21
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm7, ymm5
vpsrld ymm7, ymm4, 25
vpslld ymm11, ymm4, 7
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm5, ymm7
vpand ymm7, ymm4, ymm6
vpandn ymm11, ymm4, ymm10
vpxor ymm7, ymm7, ymm11
vpaddd ymm2, ymm14, ymm2
vpaddd ymm2, ymm2, ymm7
vpbroadcastd ymm7, dword ptr [rip + LCPI2_25] ## ymm7 = [2554220882,2554220882,2554220882,2554220882,2554220882,2554220882,2554220882,2554220882]
vpaddd ymm2, ymm2, ymm7
vpaddd ymm5, ymm5, ymm2
vpsrld ymm2, ymm0, 2
vpslld ymm7, ymm0, 30
vpor ymm2, ymm7, ymm2
vpsrld ymm7, ymm0, 13
vpslld ymm11, ymm0, 19
vpor ymm7, ymm11, ymm7
vpxor ymm2, ymm7, ymm2
vpsrld ymm7, ymm0, 22
vpslld ymm11, ymm0, 10
vpor ymm7, ymm11, ymm7
vpxor ymm7, ymm2, ymm7
vpand ymm2, ymm0, ymm3
vpxor ymm1, ymm2, ymm1
vpand ymm11, ymm0, ymm9
vpxor ymm1, ymm1, ymm11
vpaddd ymm1, ymm7, ymm1
vpaddd ymm8, ymm5, ymm8
vpaddd ymm1, ymm1, ymm5
vmovdqa ymmword ptr [rsp], ymm15 ## 32-byte Spill
vpsrld ymm5, ymm15, 17
vpslld ymm7, ymm15, 15
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm15, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm7
vmovdqa ymm13, ymmword ptr [rsp + 128] ## 32-byte Reload
vpsrld ymm7, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm7, ymm7, ymm12
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm7, ymmword ptr [rsp + 224] ## 32-byte Folded Reload
vpaddd ymm7, ymm7, ymmword ptr [rsp + 96] ## 32-byte Folded Reload
vpaddd ymm15, ymm7, ymm5
vpsrld ymm5, ymm8, 6
vpslld ymm7, ymm8, 26
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm8, 11
vpslld ymm11, ymm8, 21
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm7, ymm5
vpsrld ymm7, ymm8, 25
vpslld ymm11, ymm8, 7
vpor ymm7, ymm11, ymm7
vpxor ymm5, ymm5, ymm7
vpand ymm7, ymm8, ymm4
vpandn ymm11, ymm8, ymm6
vpxor ymm7, ymm7, ymm11
vpaddd ymm10, ymm15, ymm10
vpaddd ymm7, ymm10, ymm7
vpbroadcastd ymm10, dword ptr [rip + LCPI2_26] ## ymm10 = [2821834349,2821834349,2821834349,2821834349,2821834349,2821834349,2821834349,2821834349]
vpaddd ymm7, ymm7, ymm10
vpaddd ymm7, ymm5, ymm7
vpsrld ymm5, ymm1, 2
vpslld ymm10, ymm1, 30
vpor ymm5, ymm10, ymm5
vpsrld ymm10, ymm1, 13
vpslld ymm11, ymm1, 19
vpor ymm10, ymm11, ymm10
vpxor ymm5, ymm10, ymm5
vpsrld ymm10, ymm1, 22
vpslld ymm11, ymm1, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm5, ymm10
vpand ymm5, ymm1, ymm0
vpxor ymm2, ymm5, ymm2
vpand ymm11, ymm1, ymm3
vpxor ymm2, ymm2, ymm11
vpaddd ymm2, ymm10, ymm2
vpaddd ymm9, ymm7, ymm9
vpaddd ymm2, ymm2, ymm7
vmovdqa ymmword ptr [rsp + 512], ymm14 ## 32-byte Spill
vpsrld ymm7, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 160] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 128] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 448] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm7
vpsrld ymm7, ymm9, 6
vpslld ymm10, ymm9, 26
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm9, 11
vpslld ymm11, ymm9, 21
vpor ymm10, ymm11, ymm10
vpxor ymm7, ymm10, ymm7
vpsrld ymm10, ymm9, 25
vpslld ymm11, ymm9, 7
vpor ymm10, ymm11, ymm10
vpxor ymm7, ymm7, ymm10
vpand ymm10, ymm9, ymm8
vpandn ymm11, ymm9, ymm4
vpxor ymm10, ymm10, ymm11
vpaddd ymm6, ymm14, ymm6
vpaddd ymm6, ymm6, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_27] ## ymm10 = [2952996808,2952996808,2952996808,2952996808,2952996808,2952996808,2952996808,2952996808]
vpaddd ymm6, ymm6, ymm10
vpaddd ymm10, ymm7, ymm6
vpsrld ymm6, ymm2, 2
vpslld ymm7, ymm2, 30
vpor ymm6, ymm7, ymm6
vpsrld ymm7, ymm2, 13
vpslld ymm11, ymm2, 19
vpor ymm7, ymm11, ymm7
vpxor ymm6, ymm7, ymm6
vpsrld ymm7, ymm2, 22
vpslld ymm11, ymm2, 10
vpor ymm7, ymm11, ymm7
vpxor ymm6, ymm6, ymm7
vpand ymm7, ymm2, ymm1
vpxor ymm5, ymm7, ymm5
vpand ymm11, ymm2, ymm0
vpxor ymm5, ymm5, ymm11
vpaddd ymm5, ymm6, ymm5
vpaddd ymm6, ymm10, ymm3
vpaddd ymm3, ymm5, ymm10
vmovdqa ymmword ptr [rsp + 608], ymm15 ## 32-byte Spill
vpsrld ymm5, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm5, ymm10, ymm5
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 32] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 64] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm5
vpsrld ymm5, ymm6, 6
vpslld ymm10, ymm6, 26
vpor ymm5, ymm10, ymm5
vpsrld ymm10, ymm6, 11
vpslld ymm11, ymm6, 21
vpor ymm10, ymm11, ymm10
vpxor ymm5, ymm10, ymm5
vpsrld ymm10, ymm6, 25
vpslld ymm11, ymm6, 7
vpor ymm10, ymm11, ymm10
vpxor ymm5, ymm5, ymm10
vpand ymm10, ymm6, ymm9
vpandn ymm11, ymm6, ymm8
vpxor ymm10, ymm10, ymm11
vpaddd ymm4, ymm15, ymm4
vpaddd ymm4, ymm4, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_28] ## ymm10 = [3210313671,3210313671,3210313671,3210313671,3210313671,3210313671,3210313671,3210313671]
vpaddd ymm4, ymm4, ymm10
vpaddd ymm5, ymm5, ymm4
vpsrld ymm4, ymm3, 2
vpslld ymm10, ymm3, 30
vpor ymm4, ymm10, ymm4
vpsrld ymm10, ymm3, 13
vpslld ymm11, ymm3, 19
vpor ymm10, ymm11, ymm10
vpxor ymm4, ymm10, ymm4
vpsrld ymm10, ymm3, 22
vpslld ymm11, ymm3, 10
vpor ymm10, ymm11, ymm10
vpxor ymm4, ymm4, ymm10
vpand ymm10, ymm3, ymm2
vpxor ymm7, ymm10, ymm7
vpand ymm11, ymm3, ymm1
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm4, ymm7
vpaddd ymm4, ymm5, ymm0
vpaddd ymm5, ymm7, ymm5
vmovdqa ymmword ptr [rsp + 128], ymm14 ## 32-byte Spill
vpsrld ymm0, ymm14, 17
vpslld ymm7, ymm14, 15
vpor ymm0, ymm7, ymm0
vpsrld ymm7, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm14, 10
vpxor ymm0, ymm0, ymm11
vpxor ymm0, ymm0, ymm7
vmovdqa ymm14, ymmword ptr [rsp + 480] ## 32-byte Reload
vpsrld ymm7, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm7, ymm11, ymm7
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm7, ymm7, ymm12
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm7, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm7, ymm7, ymmword ptr [rsp + 416] ## 32-byte Folded Reload
vpaddd ymm11, ymm7, ymm0
vmovdqa ymmword ptr [rsp + 32], ymm11 ## 32-byte Spill
vpsrld ymm0, ymm4, 6
vpslld ymm7, ymm4, 26
vpor ymm0, ymm7, ymm0
vpsrld ymm7, ymm4, 11
vpslld ymm12, ymm4, 21
vpor ymm7, ymm12, ymm7
vpxor ymm0, ymm7, ymm0
vpsrld ymm7, ymm4, 25
vpslld ymm12, ymm4, 7
vpor ymm7, ymm12, ymm7
vpxor ymm0, ymm0, ymm7
vpand ymm7, ymm4, ymm6
vpandn ymm12, ymm4, ymm9
vpxor ymm7, ymm7, ymm12
vpaddd ymm8, ymm11, ymm8
vpaddd ymm7, ymm8, ymm7
vpbroadcastd ymm8, dword ptr [rip + LCPI2_29] ## ymm8 = [3336571891,3336571891,3336571891,3336571891,3336571891,3336571891,3336571891,3336571891]
vpaddd ymm7, ymm7, ymm8
vpaddd ymm7, ymm0, ymm7
vpsrld ymm0, ymm5, 2
vpslld ymm8, ymm5, 30
vpor ymm0, ymm8, ymm0
vpsrld ymm8, ymm5, 13
vpslld ymm12, ymm5, 19
vpor ymm8, ymm12, ymm8
vpxor ymm0, ymm8, ymm0
vpsrld ymm8, ymm5, 22
vpslld ymm12, ymm5, 10
vpor ymm8, ymm12, ymm8
vpxor ymm0, ymm0, ymm8
vpand ymm8, ymm5, ymm3
vpxor ymm10, ymm8, ymm10
vpand ymm12, ymm5, ymm2
vpxor ymm10, ymm10, ymm12
vpaddd ymm10, ymm0, ymm10
vpaddd ymm0, ymm7, ymm1
vpaddd ymm7, ymm10, ymm7
vmovdqa ymmword ptr [rsp + 576], ymm15 ## 32-byte Spill
vpsrld ymm1, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm15, 19
vpslld ymm12, ymm15, 13
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm15, 10
vpxor ymm1, ymm1, ymm12
vpxor ymm1, ymm1, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 320] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm12, ymm13, 25
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm13, 18
vpslld ymm11, ymm13, 14
vpor ymm11, ymm11, ymm12
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 384] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm1
vpsrld ymm1, ymm0, 6
vpslld ymm10, ymm0, 26
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm0, 11
vpslld ymm11, ymm0, 21
vpor ymm10, ymm11, ymm10
vpxor ymm1, ymm10, ymm1
vpsrld ymm10, ymm0, 25
vpslld ymm11, ymm0, 7
vpor ymm10, ymm11, ymm10
vpxor ymm1, ymm1, ymm10
vpand ymm10, ymm0, ymm4
vpandn ymm11, ymm0, ymm6
vpxor ymm10, ymm10, ymm11
vpaddd ymm9, ymm14, ymm9
vpaddd ymm9, ymm9, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_30] ## ymm10 = [3584528711,3584528711,3584528711,3584528711,3584528711,3584528711,3584528711,3584528711]
vpaddd ymm9, ymm9, ymm10
vpaddd ymm10, ymm1, ymm9
vpsrld ymm1, ymm7, 2
vpslld ymm9, ymm7, 30
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm7, 13
vpslld ymm11, ymm7, 19
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm9, ymm1
vpsrld ymm9, ymm7, 22
vpslld ymm11, ymm7, 10
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm1, ymm9
vpand ymm9, ymm7, ymm5
vpxor ymm8, ymm9, ymm8
vpand ymm11, ymm7, ymm3
vpxor ymm8, ymm8, ymm11
vpaddd ymm8, ymm1, ymm8
vpaddd ymm1, ymm10, ymm2
vpaddd ymm8, ymm8, ymm10
vmovdqa ymm12, ymmword ptr [rsp + 32] ## 32-byte Reload
vpsrld ymm2, ymm12, 17
vpslld ymm10, ymm12, 15
vpor ymm2, ymm10, ymm2
vpsrld ymm10, ymm12, 19
vpslld ymm11, ymm12, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm12, 10
vpxor ymm2, ymm2, ymm11
vpxor ymm2, ymm2, ymm10
vmovdqa ymm15, ymmword ptr [rsp + 256] ## 32-byte Reload
vpsrld ymm10, ymm15, 7
vpslld ymm11, ymm15, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 18
vpslld ymm12, ymm15, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm15, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm13
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm2
vpsrld ymm2, ymm1, 6
vpslld ymm10, ymm1, 26
vpor ymm2, ymm10, ymm2
vpsrld ymm10, ymm1, 11
vpslld ymm11, ymm1, 21
vpor ymm10, ymm11, ymm10
vpxor ymm2, ymm10, ymm2
vpsrld ymm10, ymm1, 25
vpslld ymm11, ymm1, 7
vpor ymm10, ymm11, ymm10
vpxor ymm2, ymm2, ymm10
vpand ymm10, ymm1, ymm0
vpandn ymm11, ymm1, ymm4
vpxor ymm10, ymm10, ymm11
vpaddd ymm6, ymm15, ymm6
vpaddd ymm6, ymm6, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_31] ## ymm10 = [113926993,113926993,113926993,113926993,113926993,113926993,113926993,113926993]
vpaddd ymm6, ymm6, ymm10
vpaddd ymm10, ymm2, ymm6
vpsrld ymm2, ymm8, 2
vpslld ymm6, ymm8, 30
vpor ymm2, ymm6, ymm2
vpsrld ymm6, ymm8, 13
vpslld ymm11, ymm8, 19
vpor ymm6, ymm11, ymm6
vpxor ymm2, ymm6, ymm2
vpsrld ymm6, ymm8, 22
vpslld ymm11, ymm8, 10
vpor ymm6, ymm11, ymm6
vpxor ymm6, ymm2, ymm6
vpand ymm2, ymm8, ymm7
vpxor ymm9, ymm2, ymm9
vpand ymm11, ymm8, ymm5
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm6, ymm9
vpaddd ymm6, ymm10, ymm3
vpaddd ymm3, ymm9, ymm10
vmovdqa ymmword ptr [rsp + 544], ymm14 ## 32-byte Spill
vpsrld ymm9, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 192] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 256] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 512] ## 32-byte Folded Reload
vpaddd ymm13, ymm10, ymm9
vpsrld ymm9, ymm6, 6
vpslld ymm10, ymm6, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm6, 11
vpslld ymm11, ymm6, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm6, 25
vpslld ymm11, ymm6, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm6, ymm1
vpandn ymm11, ymm6, ymm0
vpxor ymm10, ymm10, ymm11
vpaddd ymm4, ymm13, ymm4
vpaddd ymm4, ymm4, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_32] ## ymm10 = [338241895,338241895,338241895,338241895,338241895,338241895,338241895,338241895]
vpaddd ymm4, ymm4, ymm10
vpaddd ymm4, ymm9, ymm4
vpsrld ymm9, ymm3, 2
vpslld ymm10, ymm3, 30
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm3, 13
vpslld ymm11, ymm3, 19
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm3, 22
vpslld ymm11, ymm3, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm9, ymm10
vpand ymm9, ymm3, ymm8
vpxor ymm2, ymm9, ymm2
vpand ymm11, ymm3, ymm7
vpxor ymm2, ymm2, ymm11
vpaddd ymm10, ymm10, ymm2
vpaddd ymm2, ymm4, ymm5
vpaddd ymm4, ymm10, ymm4
vmovdqa ymmword ptr [rsp + 320], ymm15 ## 32-byte Spill
vpsrld ymm5, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm5, ymm10, ymm5
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm10
vmovdqa ymm14, ymmword ptr [rsp + 288] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 192] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 608] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm5
vpsrld ymm5, ymm2, 6
vpslld ymm10, ymm2, 26
vpor ymm5, ymm10, ymm5
vpsrld ymm10, ymm2, 11
vpslld ymm11, ymm2, 21
vpor ymm10, ymm11, ymm10
vpxor ymm5, ymm10, ymm5
vpsrld ymm10, ymm2, 25
vpslld ymm11, ymm2, 7
vpor ymm10, ymm11, ymm10
vpxor ymm5, ymm5, ymm10
vpand ymm10, ymm2, ymm6
vpandn ymm11, ymm2, ymm1
vpxor ymm10, ymm10, ymm11
vpaddd ymm0, ymm15, ymm0
vpaddd ymm0, ymm0, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_33] ## ymm10 = [666307205,666307205,666307205,666307205,666307205,666307205,666307205,666307205]
vpaddd ymm0, ymm0, ymm10
vpaddd ymm5, ymm5, ymm0
vpsrld ymm0, ymm4, 2
vpslld ymm10, ymm4, 30
vpor ymm0, ymm10, ymm0
vpsrld ymm10, ymm4, 13
vpslld ymm11, ymm4, 19
vpor ymm10, ymm11, ymm10
vpxor ymm0, ymm10, ymm0
vpsrld ymm10, ymm4, 22
vpslld ymm11, ymm4, 10
vpor ymm10, ymm11, ymm10
vpxor ymm0, ymm0, ymm10
vpand ymm10, ymm4, ymm3
vpxor ymm9, ymm10, ymm9
vpand ymm11, ymm4, ymm8
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm0, ymm9
vpaddd ymm0, ymm5, ymm7
vpaddd ymm5, ymm9, ymm5
vmovdqa ymmword ptr [rsp + 160], ymm13 ## 32-byte Spill
vpsrld ymm7, ymm13, 17
vpslld ymm9, ymm13, 15
vpor ymm7, ymm9, ymm7
vpsrld ymm9, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm9
vmovdqa ymm13, ymmword ptr [rsp + 96] ## 32-byte Reload
vpsrld ymm9, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm9, ymm14
vpaddd ymm9, ymm9, ymmword ptr [rsp + 128] ## 32-byte Folded Reload
vpaddd ymm13, ymm9, ymm7
vpsrld ymm7, ymm0, 6
vpslld ymm9, ymm0, 26
vpor ymm7, ymm9, ymm7
vpsrld ymm9, ymm0, 11
vpslld ymm11, ymm0, 21
vpor ymm9, ymm11, ymm9
vpxor ymm7, ymm9, ymm7
vpsrld ymm9, ymm0, 25
vpslld ymm11, ymm0, 7
vpor ymm9, ymm11, ymm9
vpxor ymm7, ymm7, ymm9
vpand ymm9, ymm0, ymm2
vpandn ymm11, ymm0, ymm6
vpxor ymm9, ymm9, ymm11
vpaddd ymm1, ymm13, ymm1
vpaddd ymm1, ymm1, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_34] ## ymm9 = [773529912,773529912,773529912,773529912,773529912,773529912,773529912,773529912]
vpaddd ymm1, ymm1, ymm9
vpaddd ymm7, ymm7, ymm1
vpsrld ymm1, ymm5, 2
vpslld ymm9, ymm5, 30
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm5, 13
vpslld ymm11, ymm5, 19
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm9, ymm1
vpsrld ymm9, ymm5, 22
vpslld ymm11, ymm5, 10
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm1, ymm9
vpand ymm9, ymm5, ymm4
vpxor ymm10, ymm9, ymm10
vpand ymm11, ymm5, ymm3
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm1, ymm10
vpaddd ymm1, ymm7, ymm8
vpaddd ymm7, ymm10, ymm7
vmovdqa ymmword ptr [rsp + 192], ymm15 ## 32-byte Spill
vpsrld ymm8, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm8, ymm10, ymm8
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm8, ymm8, ymm11
vpxor ymm8, ymm8, ymm10
vmovdqa ymm14, ymmword ptr [rsp + 448] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 96] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 576] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm8
vpsrld ymm8, ymm1, 6
vpslld ymm10, ymm1, 26
vpor ymm8, ymm10, ymm8
vpsrld ymm10, ymm1, 11
vpslld ymm11, ymm1, 21
vpor ymm10, ymm11, ymm10
vpxor ymm8, ymm10, ymm8
vpsrld ymm10, ymm1, 25
vpslld ymm11, ymm1, 7
vpor ymm10, ymm11, ymm10
vpxor ymm8, ymm8, ymm10
vpand ymm10, ymm1, ymm0
vpandn ymm11, ymm1, ymm2
vpxor ymm10, ymm10, ymm11
vpaddd ymm6, ymm15, ymm6
vpaddd ymm6, ymm6, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_35] ## ymm10 = [1294757372,1294757372,1294757372,1294757372,1294757372,1294757372,1294757372,1294757372]
vpaddd ymm6, ymm6, ymm10
vpaddd ymm6, ymm8, ymm6
vpsrld ymm8, ymm7, 2
vpslld ymm10, ymm7, 30
vpor ymm8, ymm10, ymm8
vpsrld ymm10, ymm7, 13
vpslld ymm11, ymm7, 19
vpor ymm10, ymm11, ymm10
vpxor ymm8, ymm10, ymm8
vpsrld ymm10, ymm7, 22
vpslld ymm11, ymm7, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm8, ymm10
vpand ymm8, ymm7, ymm5
vpxor ymm9, ymm8, ymm9
vpand ymm11, ymm7, ymm4
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm10, ymm9
vpaddd ymm3, ymm6, ymm3
vpaddd ymm6, ymm9, ymm6
vmovdqa ymmword ptr [rsp + 288], ymm13 ## 32-byte Spill
vpsrld ymm9, ymm13, 17
vpslld ymm10, ymm13, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 64] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm13, ymm10, ymm9
vpsrld ymm9, ymm3, 6
vpslld ymm10, ymm3, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm3, 11
vpslld ymm11, ymm3, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm3, 25
vpslld ymm11, ymm3, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm3, ymm1
vpandn ymm11, ymm3, ymm0
vpxor ymm10, ymm10, ymm11
vpaddd ymm2, ymm13, ymm2
vpaddd ymm2, ymm2, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_36] ## ymm10 = [1396182291,1396182291,1396182291,1396182291,1396182291,1396182291,1396182291,1396182291]
vpaddd ymm2, ymm2, ymm10
vpaddd ymm10, ymm9, ymm2
vpsrld ymm2, ymm6, 2
vpslld ymm9, ymm6, 30
vpor ymm2, ymm9, ymm2
vpsrld ymm9, ymm6, 13
vpslld ymm11, ymm6, 19
vpor ymm9, ymm11, ymm9
vpxor ymm2, ymm9, ymm2
vpsrld ymm9, ymm6, 22
vpslld ymm11, ymm6, 10
vpor ymm9, ymm11, ymm9
vpxor ymm2, ymm2, ymm9
vpand ymm9, ymm6, ymm7
vpxor ymm8, ymm9, ymm8
vpand ymm11, ymm6, ymm5
vpxor ymm8, ymm8, ymm11
vpaddd ymm8, ymm2, ymm8
vpaddd ymm2, ymm10, ymm4
vpaddd ymm8, ymm8, ymm10
vmovdqa ymmword ptr [rsp + 96], ymm15 ## 32-byte Spill
vpsrld ymm4, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm4, ymm10, ymm4
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm4, ymm4, ymm11
vpxor ymm4, ymm4, ymm10
vmovdqa ymm15, ymmword ptr [rsp + 416] ## 32-byte Reload
vpsrld ymm10, ymm15, 7
vpslld ymm11, ymm15, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 18
vpslld ymm12, ymm15, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm15, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 64] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 544] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm4
vpsrld ymm4, ymm2, 6
vpslld ymm10, ymm2, 26
vpor ymm4, ymm10, ymm4
vpsrld ymm10, ymm2, 11
vpslld ymm11, ymm2, 21
vpor ymm10, ymm11, ymm10
vpxor ymm4, ymm10, ymm4
vpsrld ymm10, ymm2, 25
vpslld ymm11, ymm2, 7
vpor ymm10, ymm11, ymm10
vpxor ymm4, ymm4, ymm10
vpand ymm10, ymm2, ymm3
vpandn ymm11, ymm2, ymm1
vpxor ymm10, ymm10, ymm11
vpaddd ymm0, ymm14, ymm0
vpaddd ymm0, ymm0, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_37] ## ymm10 = [1695183700,1695183700,1695183700,1695183700,1695183700,1695183700,1695183700,1695183700]
vpaddd ymm0, ymm0, ymm10
vpaddd ymm4, ymm4, ymm0
vpsrld ymm0, ymm8, 2
vpslld ymm10, ymm8, 30
vpor ymm0, ymm10, ymm0
vpsrld ymm10, ymm8, 13
vpslld ymm11, ymm8, 19
vpor ymm10, ymm11, ymm10
vpxor ymm0, ymm10, ymm0
vpsrld ymm10, ymm8, 22
vpslld ymm11, ymm8, 10
vpor ymm10, ymm11, ymm10
vpxor ymm0, ymm0, ymm10
vpand ymm10, ymm8, ymm6
vpxor ymm9, ymm10, ymm9
vpand ymm11, ymm8, ymm7
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm0, ymm9
vpaddd ymm0, ymm4, ymm5
vpaddd ymm4, ymm9, ymm4
vmovdqa ymmword ptr [rsp + 256], ymm13 ## 32-byte Spill
vpsrld ymm5, ymm13, 17
vpslld ymm9, ymm13, 15
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm9
vmovdqa ymm13, ymmword ptr [rsp + 384] ## 32-byte Reload
vpsrld ymm9, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm9, ymm15
vpaddd ymm9, ymm9, ymmword ptr [rsp + 320] ## 32-byte Folded Reload
vpaddd ymm15, ymm9, ymm5
vpsrld ymm5, ymm0, 6
vpslld ymm9, ymm0, 26
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm0, 11
vpslld ymm11, ymm0, 21
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm0, 25
vpslld ymm11, ymm0, 7
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm5, ymm9
vpand ymm9, ymm0, ymm2
vpandn ymm11, ymm0, ymm3
vpxor ymm9, ymm9, ymm11
vpaddd ymm1, ymm15, ymm1
vpaddd ymm1, ymm1, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_38] ## ymm9 = [1986661051,1986661051,1986661051,1986661051,1986661051,1986661051,1986661051,1986661051]
vpaddd ymm1, ymm1, ymm9
vpaddd ymm5, ymm5, ymm1
vpsrld ymm1, ymm4, 2
vpslld ymm9, ymm4, 30
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm4, 13
vpslld ymm11, ymm4, 19
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm9, ymm1
vpsrld ymm9, ymm4, 22
vpslld ymm11, ymm4, 10
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm1, ymm9
vpand ymm9, ymm4, ymm8
vpxor ymm10, ymm9, ymm10
vpand ymm11, ymm4, ymm6
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm1, ymm10
vpaddd ymm1, ymm5, ymm7
vpaddd ymm5, ymm10, ymm5
vmovdqa ymmword ptr [rsp + 224], ymm14 ## 32-byte Spill
vpsrld ymm7, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm10
vmovdqa ymm14, ymmword ptr [rsp] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm13
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm7
vpsrld ymm7, ymm1, 6
vpslld ymm10, ymm1, 26
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm1, 11
vpslld ymm11, ymm1, 21
vpor ymm10, ymm11, ymm10
vpxor ymm7, ymm10, ymm7
vpsrld ymm10, ymm1, 25
vpslld ymm11, ymm1, 7
vpor ymm10, ymm11, ymm10
vpxor ymm7, ymm7, ymm10
vpand ymm10, ymm1, ymm0
vpandn ymm11, ymm1, ymm2
vpxor ymm10, ymm10, ymm11
vpaddd ymm3, ymm14, ymm3
vpaddd ymm3, ymm3, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_39] ## ymm10 = [2177026350,2177026350,2177026350,2177026350,2177026350,2177026350,2177026350,2177026350]
vpaddd ymm3, ymm3, ymm10
vpaddd ymm7, ymm7, ymm3
vpsrld ymm3, ymm5, 2
vpslld ymm10, ymm5, 30
vpor ymm3, ymm10, ymm3
vpsrld ymm10, ymm5, 13
vpslld ymm11, ymm5, 19
vpor ymm10, ymm11, ymm10
vpxor ymm3, ymm10, ymm3
vpsrld ymm10, ymm5, 22
vpslld ymm11, ymm5, 10
vpor ymm10, ymm11, ymm10
vpxor ymm3, ymm3, ymm10
vpand ymm10, ymm5, ymm4
vpxor ymm9, ymm10, ymm9
vpand ymm11, ymm5, ymm8
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm3, ymm9
vpaddd ymm3, ymm7, ymm6
vpaddd ymm7, ymm9, ymm7
vmovdqa ymmword ptr [rsp + 416], ymm15 ## 32-byte Spill
vpsrld ymm6, ymm15, 17
vpslld ymm9, ymm15, 15
vpor ymm6, ymm9, ymm6
vpsrld ymm9, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm15, 10
vpxor ymm6, ymm6, ymm11
vpxor ymm6, ymm6, ymm9
vmovdqa ymm13, ymmword ptr [rsp + 512] ## 32-byte Reload
vpsrld ymm9, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vmovdqa ymm15, ymm13
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm9, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymmword ptr [rsp + 192] ## 32-byte Folded Reload
vpaddd ymm13, ymm9, ymm6
vpsrld ymm6, ymm3, 6
vpslld ymm9, ymm3, 26
vpor ymm6, ymm9, ymm6
vpsrld ymm9, ymm3, 11
vpslld ymm11, ymm3, 21
vpor ymm9, ymm11, ymm9
vpxor ymm6, ymm9, ymm6
vpsrld ymm9, ymm3, 25
vpslld ymm11, ymm3, 7
vpor ymm9, ymm11, ymm9
vpxor ymm6, ymm6, ymm9
vpand ymm9, ymm3, ymm1
vpandn ymm11, ymm3, ymm0
vpxor ymm9, ymm9, ymm11
vpaddd ymm2, ymm13, ymm2
vpaddd ymm2, ymm2, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_40] ## ymm9 = [2456956037,2456956037,2456956037,2456956037,2456956037,2456956037,2456956037,2456956037]
vpaddd ymm2, ymm2, ymm9
vpaddd ymm6, ymm6, ymm2
vpsrld ymm2, ymm7, 2
vpslld ymm9, ymm7, 30
vpor ymm2, ymm9, ymm2
vpsrld ymm9, ymm7, 13
vpslld ymm11, ymm7, 19
vpor ymm9, ymm11, ymm9
vpxor ymm2, ymm9, ymm2
vpsrld ymm9, ymm7, 22
vpslld ymm11, ymm7, 10
vpor ymm9, ymm11, ymm9
vpxor ymm9, ymm2, ymm9
vpand ymm2, ymm7, ymm5
vpxor ymm10, ymm2, ymm10
vpand ymm11, ymm7, ymm4
vpxor ymm10, ymm10, ymm11
vpaddd ymm9, ymm9, ymm10
vpaddd ymm8, ymm6, ymm8
vpaddd ymm6, ymm9, ymm6
vmovdqa ymmword ptr [rsp + 352], ymm14 ## 32-byte Spill
vpsrld ymm9, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm14, ymmword ptr [rsp + 608] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm15
vpaddd ymm10, ymm10, ymmword ptr [rsp + 288] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm9
vpsrld ymm9, ymm8, 6
vpslld ymm10, ymm8, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm8, 11
vpslld ymm11, ymm8, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm8, 25
vpslld ymm11, ymm8, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm8, ymm3
vpandn ymm11, ymm8, ymm1
vpxor ymm10, ymm10, ymm11
vpaddd ymm0, ymm15, ymm0
vpaddd ymm0, ymm0, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_41] ## ymm10 = [2730485921,2730485921,2730485921,2730485921,2730485921,2730485921,2730485921,2730485921]
vpaddd ymm0, ymm0, ymm10
vpaddd ymm10, ymm9, ymm0
vpsrld ymm0, ymm6, 2
vpslld ymm9, ymm6, 30
vpor ymm0, ymm9, ymm0
vpsrld ymm9, ymm6, 13
vpslld ymm11, ymm6, 19
vpor ymm9, ymm11, ymm9
vpxor ymm0, ymm9, ymm0
vpsrld ymm9, ymm6, 22
vpslld ymm11, ymm6, 10
vpor ymm9, ymm11, ymm9
vpxor ymm0, ymm0, ymm9
vpand ymm9, ymm6, ymm7
vpxor ymm2, ymm9, ymm2
vpand ymm11, ymm6, ymm5
vpxor ymm2, ymm2, ymm11
vpaddd ymm2, ymm0, ymm2
vpaddd ymm0, ymm10, ymm4
vpaddd ymm4, ymm2, ymm10
vmovdqa ymmword ptr [rsp + 64], ymm13 ## 32-byte Spill
vpsrld ymm2, ymm13, 17
vpslld ymm10, ymm13, 15
vpor ymm2, ymm10, ymm2
vpsrld ymm10, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 10
vpxor ymm2, ymm2, ymm11
vpxor ymm2, ymm2, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 128] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 96] ## 32-byte Folded Reload
vpaddd ymm13, ymm10, ymm2
vpsrld ymm2, ymm0, 6
vpslld ymm10, ymm0, 26
vpor ymm2, ymm10, ymm2
vpsrld ymm10, ymm0, 11
vpslld ymm11, ymm0, 21
vpor ymm10, ymm11, ymm10
vpxor ymm2, ymm10, ymm2
vpsrld ymm10, ymm0, 25
vpslld ymm11, ymm0, 7
vpor ymm10, ymm11, ymm10
vpxor ymm2, ymm2, ymm10
vpand ymm10, ymm0, ymm8
vpandn ymm11, ymm0, ymm3
vpxor ymm10, ymm10, ymm11
vpaddd ymm1, ymm13, ymm1
vpaddd ymm1, ymm1, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_42] ## ymm10 = [2820302411,2820302411,2820302411,2820302411,2820302411,2820302411,2820302411,2820302411]
vpaddd ymm1, ymm1, ymm10
vpaddd ymm2, ymm2, ymm1
vpsrld ymm1, ymm4, 2
vpslld ymm10, ymm4, 30
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm4, 13
vpslld ymm11, ymm4, 19
vpor ymm10, ymm11, ymm10
vpxor ymm1, ymm10, ymm1
vpsrld ymm10, ymm4, 22
vpslld ymm11, ymm4, 10
vpor ymm10, ymm11, ymm10
vpxor ymm1, ymm1, ymm10
vpand ymm10, ymm4, ymm6
vpxor ymm9, ymm10, ymm9
vpand ymm11, ymm4, ymm7
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm1, ymm9
vpaddd ymm1, ymm2, ymm5
vpaddd ymm2, ymm9, ymm2
vmovdqa ymmword ptr [rsp], ymm15 ## 32-byte Spill
vpsrld ymm5, ymm15, 17
vpslld ymm9, ymm15, 15
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm15, 10
vpxor ymm5, ymm5, ymm11
vpxor ymm5, ymm5, ymm9
vmovdqa ymm14, ymmword ptr [rsp + 576] ## 32-byte Reload
vpsrld ymm9, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm9, ymmword ptr [rsp + 128] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymmword ptr [rsp + 256] ## 32-byte Folded Reload
vpaddd ymm15, ymm9, ymm5
vpsrld ymm5, ymm1, 6
vpslld ymm9, ymm1, 26
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm1, 11
vpslld ymm11, ymm1, 21
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm1, 25
vpslld ymm11, ymm1, 7
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm5, ymm9
vpand ymm9, ymm1, ymm0
vpandn ymm11, ymm1, ymm8
vpxor ymm9, ymm9, ymm11
vpaddd ymm3, ymm15, ymm3
vpaddd ymm3, ymm3, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_43] ## ymm9 = [3259730800,3259730800,3259730800,3259730800,3259730800,3259730800,3259730800,3259730800]
vpaddd ymm3, ymm3, ymm9
vpaddd ymm3, ymm5, ymm3
vpsrld ymm5, ymm2, 2
vpslld ymm9, ymm2, 30
vpor ymm5, ymm9, ymm5
vpsrld ymm9, ymm2, 13
vpslld ymm11, ymm2, 19
vpor ymm9, ymm11, ymm9
vpxor ymm5, ymm9, ymm5
vpsrld ymm9, ymm2, 22
vpslld ymm11, ymm2, 10
vpor ymm9, ymm11, ymm9
vpxor ymm9, ymm5, ymm9
vpand ymm5, ymm2, ymm4
vpxor ymm10, ymm5, ymm10
vpand ymm11, ymm2, ymm6
vpxor ymm10, ymm10, ymm11
vpaddd ymm9, ymm9, ymm10
vpaddd ymm7, ymm3, ymm7
vpaddd ymm3, ymm9, ymm3
vmovdqa ymmword ptr [rsp + 480], ymm13 ## 32-byte Spill
vpsrld ymm9, ymm13, 17
vpslld ymm10, ymm13, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 32] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 224] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm9
vpsrld ymm9, ymm7, 6
vpslld ymm10, ymm7, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm7, 11
vpslld ymm11, ymm7, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm7, 25
vpslld ymm11, ymm7, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm7, ymm1
vpandn ymm11, ymm7, ymm0
vpxor ymm10, ymm10, ymm11
vpaddd ymm8, ymm14, ymm8
vpaddd ymm8, ymm8, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_44] ## ymm10 = [3345764771,3345764771,3345764771,3345764771,3345764771,3345764771,3345764771,3345764771]
vpaddd ymm8, ymm8, ymm10
vpaddd ymm9, ymm9, ymm8
vpsrld ymm8, ymm3, 2
vpslld ymm10, ymm3, 30
vpor ymm8, ymm10, ymm8
vpsrld ymm10, ymm3, 13
vpslld ymm11, ymm3, 19
vpor ymm10, ymm11, ymm10
vpxor ymm8, ymm10, ymm8
vpsrld ymm10, ymm3, 22
vpslld ymm11, ymm3, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm8, ymm10
vpand ymm8, ymm3, ymm2
vpxor ymm5, ymm8, ymm5
vpand ymm11, ymm3, ymm4
vpxor ymm5, ymm5, ymm11
vpaddd ymm5, ymm10, ymm5
vpaddd ymm6, ymm9, ymm6
vpaddd ymm5, ymm5, ymm9
vmovdqa ymmword ptr [rsp + 128], ymm15 ## 32-byte Spill
vpsrld ymm9, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 544] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vmovdqa ymm15, ymm13
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 416] ## 32-byte Folded Reload
vpaddd ymm13, ymm10, ymm9
vpsrld ymm9, ymm6, 6
vpslld ymm10, ymm6, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm6, 11
vpslld ymm11, ymm6, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm6, 25
vpslld ymm11, ymm6, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm6, ymm7
vpandn ymm11, ymm6, ymm1
vpxor ymm10, ymm10, ymm11
vpaddd ymm0, ymm13, ymm0
vpaddd ymm0, ymm0, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_45] ## ymm10 = [3516065817,3516065817,3516065817,3516065817,3516065817,3516065817,3516065817,3516065817]
vpaddd ymm0, ymm0, ymm10
vpaddd ymm9, ymm9, ymm0
vpsrld ymm0, ymm5, 2
vpslld ymm10, ymm5, 30
vpor ymm0, ymm10, ymm0
vpsrld ymm10, ymm5, 13
vpslld ymm11, ymm5, 19
vpor ymm10, ymm11, ymm10
vpxor ymm0, ymm10, ymm0
vpsrld ymm10, ymm5, 22
vpslld ymm11, ymm5, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm0, ymm10
vpand ymm0, ymm5, ymm3
vpxor ymm8, ymm0, ymm8
vpand ymm11, ymm5, ymm2
vpxor ymm8, ymm8, ymm11
vpaddd ymm10, ymm10, ymm8
vpaddd ymm8, ymm9, ymm4
vpaddd ymm4, ymm10, ymm9
vmovdqa ymmword ptr [rsp + 384], ymm14 ## 32-byte Spill
vpsrld ymm9, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm14, ymmword ptr [rsp + 320] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm15
vpaddd ymm10, ymm10, ymmword ptr [rsp + 352] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm9
vpsrld ymm9, ymm8, 6
vpslld ymm10, ymm8, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm8, 11
vpslld ymm11, ymm8, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm8, 25
vpslld ymm11, ymm8, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm8, ymm6
vpandn ymm11, ymm8, ymm7
vpxor ymm10, ymm10, ymm11
vpaddd ymm1, ymm15, ymm1
vpaddd ymm1, ymm1, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_46] ## ymm10 = [3600352804,3600352804,3600352804,3600352804,3600352804,3600352804,3600352804,3600352804]
vpaddd ymm1, ymm1, ymm10
vpaddd ymm9, ymm9, ymm1
vpsrld ymm1, ymm4, 2
vpslld ymm10, ymm4, 30
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm4, 13
vpslld ymm11, ymm4, 19
vpor ymm10, ymm11, ymm10
vpxor ymm1, ymm10, ymm1
vpsrld ymm10, ymm4, 22
vpslld ymm11, ymm4, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm1, ymm10
vpand ymm1, ymm4, ymm5
vpxor ymm0, ymm1, ymm0
vpand ymm11, ymm4, ymm3
vpxor ymm0, ymm0, ymm11
vpaddd ymm0, ymm10, ymm0
vpaddd ymm10, ymm9, ymm2
vpaddd ymm2, ymm0, ymm9
vmovdqa ymmword ptr [rsp + 448], ymm13 ## 32-byte Spill
vpsrld ymm0, ymm13, 17
vpslld ymm9, ymm13, 15
vpor ymm0, ymm9, ymm0
vpsrld ymm9, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 10
vpxor ymm0, ymm0, ymm11
vpxor ymm0, ymm0, ymm9
vmovdqa ymm13, ymmword ptr [rsp + 160] ## 32-byte Reload
vpsrld ymm9, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm9, ymm14
vpaddd ymm9, ymm9, ymmword ptr [rsp + 64] ## 32-byte Folded Reload
vpaddd ymm13, ymm9, ymm0
vpsrld ymm0, ymm10, 6
vpslld ymm9, ymm10, 26
vpor ymm0, ymm9, ymm0
vpsrld ymm9, ymm10, 11
vpslld ymm11, ymm10, 21
vpor ymm9, ymm11, ymm9
vpxor ymm0, ymm9, ymm0
vpsrld ymm9, ymm10, 25
vpslld ymm11, ymm10, 7
vpor ymm9, ymm11, ymm9
vpxor ymm0, ymm0, ymm9
vpand ymm9, ymm10, ymm8
vpandn ymm11, ymm10, ymm6
vpxor ymm9, ymm9, ymm11
vpaddd ymm7, ymm13, ymm7
vpaddd ymm7, ymm7, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_47] ## ymm9 = [4094571909,4094571909,4094571909,4094571909,4094571909,4094571909,4094571909,4094571909]
vpaddd ymm7, ymm7, ymm9
vpaddd ymm9, ymm0, ymm7
vpsrld ymm0, ymm2, 2
vpslld ymm7, ymm2, 30
vpor ymm0, ymm7, ymm0
vpsrld ymm7, ymm2, 13
vpslld ymm11, ymm2, 19
vpor ymm7, ymm11, ymm7
vpxor ymm0, ymm7, ymm0
vpsrld ymm7, ymm2, 22
vpslld ymm11, ymm2, 10
vpor ymm7, ymm11, ymm7
vpxor ymm7, ymm0, ymm7
vpand ymm0, ymm2, ymm4
vpxor ymm1, ymm0, ymm1
vpand ymm11, ymm2, ymm5
vpxor ymm1, ymm1, ymm11
vpaddd ymm1, ymm7, ymm1
vpaddd ymm7, ymm9, ymm3
vpaddd ymm3, ymm1, ymm9
vmovdqa ymmword ptr [rsp + 512], ymm15 ## 32-byte Spill
vpsrld ymm1, ymm15, 17
vpslld ymm9, ymm15, 15
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm15, 10
vpxor ymm1, ymm1, ymm11
vpxor ymm1, ymm1, ymm9
vmovdqa ymm14, ymmword ptr [rsp + 192] ## 32-byte Reload
vpsrld ymm9, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm9, ymm11, ymm9
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vmovdqa ymm15, ymm14
vpxor ymm9, ymm9, ymm12
vpxor ymm9, ymm9, ymm11
vpaddd ymm9, ymm9, ymmword ptr [rsp + 160] ## 32-byte Folded Reload
vpaddd ymm9, ymm9, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm14, ymm9, ymm1
vpsrld ymm1, ymm7, 6
vpslld ymm9, ymm7, 26
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm7, 11
vpslld ymm11, ymm7, 21
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm9, ymm1
vpsrld ymm9, ymm7, 25
vpslld ymm11, ymm7, 7
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm1, ymm9
vpand ymm9, ymm7, ymm10
vpandn ymm11, ymm7, ymm8
vpxor ymm9, ymm9, ymm11
vpaddd ymm6, ymm14, ymm6
vpaddd ymm6, ymm6, ymm9
vpbroadcastd ymm9, dword ptr [rip + LCPI2_48] ## ymm9 = [275423344,275423344,275423344,275423344,275423344,275423344,275423344,275423344]
vpaddd ymm6, ymm6, ymm9
vpaddd ymm6, ymm1, ymm6
vpsrld ymm1, ymm3, 2
vpslld ymm9, ymm3, 30
vpor ymm1, ymm9, ymm1
vpsrld ymm9, ymm3, 13
vpslld ymm11, ymm3, 19
vpor ymm9, ymm11, ymm9
vpxor ymm1, ymm9, ymm1
vpsrld ymm9, ymm3, 22
vpslld ymm11, ymm3, 10
vpor ymm9, ymm11, ymm9
vpxor ymm9, ymm1, ymm9
vpand ymm1, ymm3, ymm2
vpxor ymm0, ymm1, ymm0
vpand ymm11, ymm3, ymm4
vpxor ymm0, ymm0, ymm11
vpaddd ymm0, ymm9, ymm0
vpaddd ymm5, ymm6, ymm5
vpaddd ymm9, ymm0, ymm6
vmovdqa ymmword ptr [rsp + 32], ymm13 ## 32-byte Spill
vpsrld ymm0, ymm13, 17
vpslld ymm6, ymm13, 15
vpor ymm0, ymm6, ymm0
vpsrld ymm6, ymm13, 19
vpslld ymm11, ymm13, 13
vpor ymm6, ymm11, ymm6
vpsrld ymm11, ymm13, 10
vpxor ymm0, ymm0, ymm11
vpxor ymm0, ymm0, ymm6
vmovdqa ymm13, ymmword ptr [rsp + 288] ## 32-byte Reload
vpsrld ymm6, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm6, ymm11, ymm6
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm6, ymm6, ymm12
vpxor ymm6, ymm6, ymm11
vpaddd ymm6, ymm6, ymm15
vpaddd ymm6, ymm6, ymmword ptr [rsp + 480] ## 32-byte Folded Reload
vpaddd ymm15, ymm6, ymm0
vpsrld ymm0, ymm5, 6
vpslld ymm6, ymm5, 26
vpor ymm0, ymm6, ymm0
vpsrld ymm6, ymm5, 11
vpslld ymm11, ymm5, 21
vpor ymm6, ymm11, ymm6
vpxor ymm0, ymm6, ymm0
vpsrld ymm6, ymm5, 25
vpslld ymm11, ymm5, 7
vpor ymm6, ymm11, ymm6
vpxor ymm0, ymm0, ymm6
vpand ymm6, ymm5, ymm7
vpandn ymm11, ymm5, ymm10
vpxor ymm6, ymm6, ymm11
vpaddd ymm8, ymm15, ymm8
vpaddd ymm6, ymm8, ymm6
vpbroadcastd ymm8, dword ptr [rip + LCPI2_49] ## ymm8 = [430227734,430227734,430227734,430227734,430227734,430227734,430227734,430227734]
vpaddd ymm6, ymm6, ymm8
vpaddd ymm8, ymm0, ymm6
vpsrld ymm0, ymm9, 2
vpslld ymm6, ymm9, 30
vpor ymm0, ymm6, ymm0
vpsrld ymm6, ymm9, 13
vpslld ymm11, ymm9, 19
vpor ymm6, ymm11, ymm6
vpxor ymm0, ymm6, ymm0
vpsrld ymm6, ymm9, 22
vpslld ymm11, ymm9, 10
vpor ymm6, ymm11, ymm6
vpxor ymm6, ymm0, ymm6
vpand ymm0, ymm9, ymm3
vpxor ymm1, ymm0, ymm1
vpand ymm11, ymm9, ymm2
vpxor ymm1, ymm1, ymm11
vpaddd ymm1, ymm6, ymm1
vpaddd ymm6, ymm8, ymm4
vpaddd ymm4, ymm1, ymm8
vmovdqa ymmword ptr [rsp + 160], ymm14 ## 32-byte Spill
vpsrld ymm1, ymm14, 17
vpslld ymm8, ymm14, 15
vpor ymm1, ymm8, ymm1
vpsrld ymm8, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm8, ymm11, ymm8
vpsrld ymm11, ymm14, 10
vpxor ymm1, ymm1, ymm11
vpxor ymm1, ymm1, ymm8
vmovdqa ymm14, ymmword ptr [rsp + 96] ## 32-byte Reload
vpsrld ymm8, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm8, ymm11, ymm8
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm8, ymm8, ymm12
vpxor ymm8, ymm8, ymm11
vpaddd ymm8, ymm8, ymm13
vpaddd ymm8, ymm8, ymmword ptr [rsp + 128] ## 32-byte Folded Reload
vpaddd ymm13, ymm8, ymm1
vpsrld ymm1, ymm6, 6
vpslld ymm8, ymm6, 26
vpor ymm1, ymm8, ymm1
vpsrld ymm8, ymm6, 11
vpslld ymm11, ymm6, 21
vpor ymm8, ymm11, ymm8
vpxor ymm1, ymm8, ymm1
vpsrld ymm8, ymm6, 25
vpslld ymm11, ymm6, 7
vpor ymm8, ymm11, ymm8
vpxor ymm1, ymm1, ymm8
vpand ymm8, ymm6, ymm5
vpandn ymm11, ymm6, ymm7
vpxor ymm8, ymm8, ymm11
vpaddd ymm10, ymm13, ymm10
vpaddd ymm8, ymm10, ymm8
vpbroadcastd ymm10, dword ptr [rip + LCPI2_50] ## ymm10 = [506948616,506948616,506948616,506948616,506948616,506948616,506948616,506948616]
vpaddd ymm8, ymm8, ymm10
vpaddd ymm8, ymm1, ymm8
vpsrld ymm1, ymm4, 2
vpslld ymm10, ymm4, 30
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm4, 13
vpslld ymm11, ymm4, 19
vpor ymm10, ymm11, ymm10
vpxor ymm1, ymm10, ymm1
vpsrld ymm10, ymm4, 22
vpslld ymm11, ymm4, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm1, ymm10
vpand ymm1, ymm4, ymm9
vpxor ymm0, ymm1, ymm0
vpand ymm11, ymm4, ymm3
vpxor ymm0, ymm0, ymm11
vpaddd ymm10, ymm10, ymm0
vpaddd ymm0, ymm8, ymm2
vpaddd ymm8, ymm10, ymm8
vmovdqa ymmword ptr [rsp + 320], ymm15 ## 32-byte Spill
vpsrld ymm2, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm2, ymm10, ymm2
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm2, ymm2, ymm11
vpxor ymm2, ymm2, ymm10
vmovdqa ymm15, ymmword ptr [rsp + 256] ## 32-byte Reload
vpsrld ymm10, ymm15, 7
vpslld ymm11, ymm15, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 18
vpslld ymm12, ymm15, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm15, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 384] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm2
vpsrld ymm2, ymm0, 6
vpslld ymm10, ymm0, 26
vpor ymm2, ymm10, ymm2
vpsrld ymm10, ymm0, 11
vpslld ymm12, ymm0, 21
vpor ymm10, ymm12, ymm10
vpxor ymm2, ymm10, ymm2
vpsrld ymm10, ymm0, 25
vpslld ymm12, ymm0, 7
vpor ymm10, ymm12, ymm10
vpxor ymm2, ymm2, ymm10
vpand ymm10, ymm0, ymm6
vpandn ymm12, ymm0, ymm5
vpxor ymm10, ymm10, ymm12
vpaddd ymm7, ymm15, ymm7
vpaddd ymm7, ymm7, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_51] ## ymm10 = [659060556,659060556,659060556,659060556,659060556,659060556,659060556,659060556]
vpaddd ymm7, ymm7, ymm10
vpaddd ymm10, ymm2, ymm7
vpsrld ymm2, ymm8, 2
vpslld ymm7, ymm8, 30
vpor ymm2, ymm7, ymm2
vpsrld ymm7, ymm8, 13
vpslld ymm12, ymm8, 19
vpor ymm7, ymm12, ymm7
vpxor ymm2, ymm7, ymm2
vpsrld ymm7, ymm8, 22
vpslld ymm12, ymm8, 10
vpor ymm7, ymm12, ymm7
vpxor ymm7, ymm2, ymm7
vpand ymm2, ymm8, ymm4
vpxor ymm1, ymm2, ymm1
vpand ymm12, ymm8, ymm9
vpxor ymm1, ymm1, ymm12
vpaddd ymm1, ymm7, ymm1
vpaddd ymm7, ymm10, ymm3
vpaddd ymm3, ymm1, ymm10
vmovdqa ymmword ptr [rsp + 192], ymm13 ## 32-byte Spill
vpsrld ymm1, ymm13, 17
vpslld ymm10, ymm13, 15
vpor ymm1, ymm10, ymm1
vpsrld ymm10, ymm13, 19
vpslld ymm12, ymm13, 13
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm13, 10
vpxor ymm1, ymm1, ymm12
vpxor ymm1, ymm1, ymm10
vmovdqa ymm11, ymmword ptr [rsp + 224] ## 32-byte Reload
vpsrld ymm10, ymm11, 7
vpslld ymm12, ymm11, 25
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm11, 18
vpslld ymm14, ymm11, 14
vpor ymm12, ymm14, ymm12
vpsrld ymm14, ymm11, 3
vpxor ymm10, ymm10, ymm14
vpxor ymm10, ymm10, ymm12
vpaddd ymm10, ymm10, ymmword ptr [rsp + 256] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 448] ## 32-byte Folded Reload
vpaddd ymm11, ymm10, ymm1
vpsrld ymm1, ymm7, 6
vpslld ymm12, ymm7, 26
vpor ymm1, ymm12, ymm1
vpsrld ymm12, ymm7, 11
vpslld ymm14, ymm7, 21
vpor ymm12, ymm14, ymm12
vpxor ymm1, ymm12, ymm1
vpsrld ymm12, ymm7, 25
vpslld ymm14, ymm7, 7
vpor ymm12, ymm14, ymm12
vpxor ymm1, ymm1, ymm12
vpand ymm12, ymm7, ymm0
vpandn ymm14, ymm7, ymm6
vpxor ymm12, ymm12, ymm14
vpaddd ymm5, ymm11, ymm5
vpaddd ymm5, ymm5, ymm12
vpbroadcastd ymm12, dword ptr [rip + LCPI2_52] ## ymm12 = [883997877,883997877,883997877,883997877,883997877,883997877,883997877,883997877]
vpaddd ymm5, ymm5, ymm12
vpaddd ymm12, ymm1, ymm5
vpsrld ymm1, ymm3, 2
vpslld ymm5, ymm3, 30
vpor ymm1, ymm5, ymm1
vpsrld ymm5, ymm3, 13
vpslld ymm14, ymm3, 19
vpor ymm5, ymm14, ymm5
vpxor ymm1, ymm5, ymm1
vpsrld ymm5, ymm3, 22
vpslld ymm14, ymm3, 10
vpor ymm5, ymm14, ymm5
vpxor ymm1, ymm1, ymm5
vpand ymm5, ymm3, ymm8
vpxor ymm2, ymm5, ymm2
vpand ymm14, ymm3, ymm4
vpxor ymm2, ymm2, ymm14
vpaddd ymm2, ymm1, ymm2
vpaddd ymm1, ymm12, ymm9
vpaddd ymm9, ymm2, ymm12
vmovdqa ymmword ptr [rsp + 96], ymm15 ## 32-byte Spill
vpsrld ymm2, ymm15, 17
vpslld ymm12, ymm15, 15
vpor ymm2, ymm12, ymm2
vpsrld ymm12, ymm15, 19
vpslld ymm14, ymm15, 13
vpor ymm12, ymm14, ymm12
vpsrld ymm14, ymm15, 10
vpxor ymm2, ymm2, ymm14
vpxor ymm2, ymm2, ymm12
vmovdqa ymm10, ymmword ptr [rsp + 416] ## 32-byte Reload
vpsrld ymm12, ymm10, 7
vpslld ymm14, ymm10, 25
vpor ymm12, ymm14, ymm12
vpsrld ymm14, ymm10, 18
vpslld ymm15, ymm10, 14
vpor ymm14, ymm15, ymm14
vpsrld ymm15, ymm10, 3
vmovdqa ymm13, ymm10
vpxor ymm12, ymm12, ymm15
vpxor ymm12, ymm12, ymm14
vpaddd ymm12, ymm12, ymmword ptr [rsp + 224] ## 32-byte Folded Reload
vpaddd ymm12, ymm12, ymmword ptr [rsp + 512] ## 32-byte Folded Reload
vpaddd ymm12, ymm12, ymm2
vpsrld ymm2, ymm1, 6
vpslld ymm14, ymm1, 26
vpor ymm2, ymm14, ymm2
vpsrld ymm14, ymm1, 11
vpslld ymm15, ymm1, 21
vpor ymm14, ymm15, ymm14
vpxor ymm2, ymm14, ymm2
vpsrld ymm14, ymm1, 25
vpslld ymm15, ymm1, 7
vpor ymm14, ymm15, ymm14
vpxor ymm2, ymm2, ymm14
vpand ymm14, ymm1, ymm7
vpandn ymm15, ymm1, ymm0
vpxor ymm14, ymm14, ymm15
vpaddd ymm6, ymm12, ymm6
vpaddd ymm6, ymm6, ymm14
vpbroadcastd ymm14, dword ptr [rip + LCPI2_53] ## ymm14 = [958139571,958139571,958139571,958139571,958139571,958139571,958139571,958139571]
vpaddd ymm6, ymm6, ymm14
vpaddd ymm14, ymm2, ymm6
vpsrld ymm2, ymm9, 2
vpslld ymm6, ymm9, 30
vpor ymm2, ymm6, ymm2
vpsrld ymm6, ymm9, 13
vpslld ymm15, ymm9, 19
vpor ymm6, ymm15, ymm6
vpxor ymm2, ymm6, ymm2
vpsrld ymm6, ymm9, 22
vpslld ymm15, ymm9, 10
vpor ymm6, ymm15, ymm6
vpxor ymm2, ymm2, ymm6
vpand ymm6, ymm9, ymm3
vpxor ymm5, ymm6, ymm5
vpand ymm15, ymm9, ymm8
vpxor ymm5, ymm5, ymm15
vpaddd ymm5, ymm2, ymm5
vpaddd ymm2, ymm14, ymm4
vpaddd ymm4, ymm5, ymm14
vmovdqa ymmword ptr [rsp + 256], ymm11 ## 32-byte Spill
vpsrld ymm5, ymm11, 17
vpslld ymm14, ymm11, 15
vpor ymm5, ymm14, ymm5
vpsrld ymm14, ymm11, 19
vpslld ymm15, ymm11, 13
vpor ymm14, ymm15, ymm14
vpsrld ymm15, ymm11, 10
vpxor ymm5, ymm5, ymm15
vpxor ymm5, ymm5, ymm14
vmovdqa ymm11, ymmword ptr [rsp + 352] ## 32-byte Reload
vpsrld ymm14, ymm11, 7
vpslld ymm15, ymm11, 25
vpor ymm14, ymm15, ymm14
vpsrld ymm15, ymm11, 18
vpslld ymm10, ymm11, 14
vpor ymm10, ymm10, ymm15
vpsrld ymm15, ymm11, 3
vpxor ymm14, ymm14, ymm15
vpxor ymm10, ymm14, ymm10
vpaddd ymm10, ymm10, ymm13
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm5
vpsrld ymm5, ymm2, 6
vpslld ymm10, ymm2, 26
vpor ymm5, ymm10, ymm5
vpsrld ymm10, ymm2, 11
vpslld ymm15, ymm2, 21
vpor ymm10, ymm15, ymm10
vpxor ymm5, ymm10, ymm5
vpsrld ymm10, ymm2, 25
vpslld ymm15, ymm2, 7
vpor ymm10, ymm15, ymm10
vpxor ymm5, ymm5, ymm10
vpand ymm10, ymm2, ymm1
vpandn ymm15, ymm2, ymm7
vpxor ymm10, ymm10, ymm15
vpaddd ymm0, ymm14, ymm0
vpaddd ymm0, ymm0, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_54] ## ymm10 = [1322822218,1322822218,1322822218,1322822218,1322822218,1322822218,1322822218,1322822218]
vpaddd ymm0, ymm0, ymm10
vpaddd ymm5, ymm5, ymm0
vpsrld ymm0, ymm4, 2
vpslld ymm10, ymm4, 30
vpor ymm0, ymm10, ymm0
vpsrld ymm10, ymm4, 13
vpslld ymm15, ymm4, 19
vpor ymm10, ymm15, ymm10
vpxor ymm0, ymm10, ymm0
vpsrld ymm10, ymm4, 22
vpslld ymm15, ymm4, 10
vpor ymm10, ymm15, ymm10
vpxor ymm10, ymm0, ymm10
vpand ymm0, ymm4, ymm9
vpxor ymm6, ymm0, ymm6
vpand ymm15, ymm4, ymm3
vpxor ymm6, ymm6, ymm15
vpaddd ymm6, ymm10, ymm6
vpaddd ymm8, ymm5, ymm8
vpaddd ymm5, ymm6, ymm5
vmovdqa ymmword ptr [rsp + 224], ymm12 ## 32-byte Spill
vpsrld ymm6, ymm12, 17
vpslld ymm10, ymm12, 15
vpor ymm6, ymm10, ymm6
vpsrld ymm10, ymm12, 19
vpslld ymm15, ymm12, 13
vpor ymm10, ymm15, ymm10
vpsrld ymm15, ymm12, 10
vpxor ymm6, ymm6, ymm15
vpxor ymm6, ymm6, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 64] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm15, ymm13, 25
vpor ymm10, ymm15, ymm10
vpsrld ymm15, ymm13, 18
vpslld ymm11, ymm13, 14
vpor ymm11, ymm11, ymm15
vpsrld ymm15, ymm13, 3
vpxor ymm10, ymm10, ymm15
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 352] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm6
vpsrld ymm6, ymm8, 6
vpslld ymm10, ymm8, 26
vpor ymm6, ymm10, ymm6
vpsrld ymm10, ymm8, 11
vpslld ymm11, ymm8, 21
vpor ymm10, ymm11, ymm10
vpxor ymm6, ymm10, ymm6
vpsrld ymm10, ymm8, 25
vpslld ymm11, ymm8, 7
vpor ymm10, ymm11, ymm10
vpxor ymm6, ymm6, ymm10
vpand ymm10, ymm8, ymm2
vpandn ymm11, ymm8, ymm1
vpxor ymm10, ymm10, ymm11
vpaddd ymm7, ymm15, ymm7
vpaddd ymm7, ymm7, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_55] ## ymm10 = [1537002063,1537002063,1537002063,1537002063,1537002063,1537002063,1537002063,1537002063]
vpaddd ymm7, ymm7, ymm10
vpaddd ymm7, ymm6, ymm7
vpsrld ymm6, ymm5, 2
vpslld ymm10, ymm5, 30
vpor ymm6, ymm10, ymm6
vpsrld ymm10, ymm5, 13
vpslld ymm11, ymm5, 19
vpor ymm10, ymm11, ymm10
vpxor ymm6, ymm10, ymm6
vpsrld ymm10, ymm5, 22
vpslld ymm11, ymm5, 10
vpor ymm10, ymm11, ymm10
vpxor ymm10, ymm6, ymm10
vpand ymm6, ymm5, ymm4
vpxor ymm0, ymm6, ymm0
vpand ymm11, ymm5, ymm9
vpxor ymm0, ymm0, ymm11
vpaddd ymm10, ymm10, ymm0
vpaddd ymm0, ymm7, ymm3
vpaddd ymm3, ymm10, ymm7
vmovdqa ymmword ptr [rsp + 288], ymm14 ## 32-byte Spill
vpsrld ymm7, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm10
vmovdqa ymm14, ymmword ptr [rsp] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm13
vpaddd ymm10, ymm10, ymmword ptr [rsp + 320] ## 32-byte Folded Reload
vpaddd ymm14, ymm10, ymm7
vpsrld ymm7, ymm0, 6
vpslld ymm10, ymm0, 26
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm0, 11
vpslld ymm11, ymm0, 21
vpor ymm10, ymm11, ymm10
vpxor ymm7, ymm10, ymm7
vpsrld ymm10, ymm0, 25
vpslld ymm11, ymm0, 7
vpor ymm10, ymm11, ymm10
vpxor ymm7, ymm7, ymm10
vpand ymm10, ymm0, ymm8
vpandn ymm11, ymm0, ymm2
vpxor ymm10, ymm10, ymm11
vpaddd ymm1, ymm14, ymm1
vpaddd ymm1, ymm1, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_56] ## ymm10 = [1747873779,1747873779,1747873779,1747873779,1747873779,1747873779,1747873779,1747873779]
vpaddd ymm1, ymm1, ymm10
vpaddd ymm10, ymm7, ymm1
vpsrld ymm1, ymm3, 2
vpslld ymm7, ymm3, 30
vpor ymm1, ymm7, ymm1
vpsrld ymm7, ymm3, 13
vpslld ymm11, ymm3, 19
vpor ymm7, ymm11, ymm7
vpxor ymm1, ymm7, ymm1
vpsrld ymm7, ymm3, 22
vpslld ymm11, ymm3, 10
vpor ymm7, ymm11, ymm7
vpxor ymm1, ymm1, ymm7
vpand ymm7, ymm3, ymm5
vpxor ymm6, ymm7, ymm6
vpand ymm11, ymm3, ymm4
vpxor ymm6, ymm6, ymm11
vpaddd ymm6, ymm1, ymm6
vpaddd ymm1, ymm10, ymm9
vpaddd ymm6, ymm6, ymm10
vmovdqa ymmword ptr [rsp + 352], ymm15 ## 32-byte Spill
vpsrld ymm9, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm15, 19
vpslld ymm11, ymm15, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm15, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 480] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 192] ## 32-byte Folded Reload
vpaddd ymm15, ymm10, ymm9
vpsrld ymm9, ymm1, 6
vpslld ymm10, ymm1, 26
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm1, 11
vpslld ymm11, ymm1, 21
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm1, 25
vpslld ymm11, ymm1, 7
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpand ymm10, ymm1, ymm0
vpandn ymm11, ymm1, ymm8
vpxor ymm10, ymm10, ymm11
vpaddd ymm2, ymm15, ymm2
vpaddd ymm2, ymm2, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_57] ## ymm10 = [1955562222,1955562222,1955562222,1955562222,1955562222,1955562222,1955562222,1955562222]
vpaddd ymm2, ymm2, ymm10
vpaddd ymm10, ymm9, ymm2
vpsrld ymm2, ymm6, 2
vpslld ymm9, ymm6, 30
vpor ymm2, ymm9, ymm2
vpsrld ymm9, ymm6, 13
vpslld ymm11, ymm6, 19
vpor ymm9, ymm11, ymm9
vpxor ymm2, ymm9, ymm2
vpsrld ymm9, ymm6, 22
vpslld ymm11, ymm6, 10
vpor ymm9, ymm11, ymm9
vpxor ymm2, ymm2, ymm9
vpand ymm9, ymm6, ymm3
vpxor ymm7, ymm9, ymm7
vpand ymm11, ymm6, ymm5
vpxor ymm7, ymm7, ymm11
vpaddd ymm7, ymm2, ymm7
vpaddd ymm2, ymm10, ymm4
vpaddd ymm4, ymm7, ymm10
vmovdqa ymmword ptr [rsp + 64], ymm14 ## 32-byte Spill
vpsrld ymm7, ymm14, 17
vpslld ymm10, ymm14, 15
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm14, 19
vpslld ymm11, ymm14, 13
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm10
vmovdqa ymm14, ymmword ptr [rsp + 128] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm11, ymm14, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm14, 18
vpslld ymm12, ymm14, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymmword ptr [rsp + 480] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 96] ## 32-byte Folded Reload
vpaddd ymm11, ymm10, ymm7
vpsrld ymm7, ymm2, 6
vpslld ymm10, ymm2, 26
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm2, 11
vpslld ymm12, ymm2, 21
vpor ymm10, ymm12, ymm10
vpxor ymm7, ymm10, ymm7
vpsrld ymm10, ymm2, 25
vpslld ymm12, ymm2, 7
vpor ymm10, ymm12, ymm10
vpxor ymm7, ymm7, ymm10
vpand ymm10, ymm2, ymm1
vpandn ymm12, ymm2, ymm0
vpxor ymm10, ymm10, ymm12
vpaddd ymm8, ymm11, ymm8
vpaddd ymm8, ymm8, ymm10
vpbroadcastd ymm10, dword ptr [rip + LCPI2_58] ## ymm10 = [2024104815,2024104815,2024104815,2024104815,2024104815,2024104815,2024104815,2024104815]
vpaddd ymm8, ymm8, ymm10
vpaddd ymm8, ymm7, ymm8
vpsrld ymm7, ymm4, 2
vpslld ymm10, ymm4, 30
vpor ymm7, ymm10, ymm7
vpsrld ymm10, ymm4, 13
vpslld ymm12, ymm4, 19
vpor ymm10, ymm12, ymm10
vpxor ymm7, ymm10, ymm7
vpsrld ymm10, ymm4, 22
vpslld ymm12, ymm4, 10
vpor ymm10, ymm12, ymm10
vpxor ymm10, ymm7, ymm10
vpand ymm7, ymm4, ymm6
vpxor ymm9, ymm7, ymm9
vpand ymm12, ymm4, ymm3
vpxor ymm9, ymm9, ymm12
vpaddd ymm9, ymm10, ymm9
vpaddd ymm5, ymm8, ymm5
vpaddd ymm9, ymm9, ymm8
vmovdqa ymmword ptr [rsp], ymm15 ## 32-byte Spill
vpsrld ymm8, ymm15, 17
vpslld ymm10, ymm15, 15
vpor ymm8, ymm10, ymm8
vpsrld ymm10, ymm15, 19
vpslld ymm12, ymm15, 13
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm15, 10
vpxor ymm8, ymm8, ymm12
vpxor ymm8, ymm8, ymm10
vmovdqa ymm15, ymmword ptr [rsp + 384] ## 32-byte Reload
vpsrld ymm10, ymm15, 7
vpslld ymm12, ymm15, 25
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm15, 18
vpslld ymm13, ymm15, 14
vpor ymm12, ymm13, ymm12
vpsrld ymm13, ymm15, 3
vpxor ymm10, ymm10, ymm13
vpxor ymm10, ymm10, ymm12
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 256] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymm8
vpsrld ymm8, ymm5, 6
vpslld ymm12, ymm5, 26
vpor ymm8, ymm12, ymm8
vpsrld ymm12, ymm5, 11
vpslld ymm13, ymm5, 21
vpor ymm12, ymm13, ymm12
vpxor ymm8, ymm12, ymm8
vpsrld ymm12, ymm5, 25
vpslld ymm13, ymm5, 7
vpor ymm12, ymm13, ymm12
vpxor ymm8, ymm8, ymm12
vpand ymm12, ymm5, ymm2
vpandn ymm13, ymm5, ymm1
vpxor ymm12, ymm12, ymm13
vpaddd ymm0, ymm10, ymm0
vpaddd ymm0, ymm0, ymm12
vpbroadcastd ymm12, dword ptr [rip + LCPI2_59] ## ymm12 = [2227730452,2227730452,2227730452,2227730452,2227730452,2227730452,2227730452,2227730452]
vpaddd ymm0, ymm0, ymm12
vpaddd ymm12, ymm8, ymm0
vpsrld ymm0, ymm9, 2
vpslld ymm8, ymm9, 30
vpor ymm0, ymm8, ymm0
vpsrld ymm8, ymm9, 13
vpslld ymm13, ymm9, 19
vpor ymm8, ymm13, ymm8
vpxor ymm0, ymm8, ymm0
vpsrld ymm8, ymm9, 22
vpslld ymm13, ymm9, 10
vpor ymm8, ymm13, ymm8
vpxor ymm8, ymm0, ymm8
vpand ymm0, ymm9, ymm4
vpxor ymm7, ymm0, ymm7
vpand ymm13, ymm9, ymm6
vpxor ymm7, ymm7, ymm13
vpaddd ymm7, ymm8, ymm7
vpaddd ymm8, ymm12, ymm3
vpaddd ymm3, ymm7, ymm12
vpsrld ymm7, ymm11, 17
vpslld ymm12, ymm11, 15
vpor ymm7, ymm12, ymm7
vpsrld ymm12, ymm11, 19
vpslld ymm13, ymm11, 13
vpor ymm12, ymm13, ymm12
vpsrld ymm11, ymm11, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm12
vmovdqa ymm14, ymmword ptr [rsp + 448] ## 32-byte Reload
vpsrld ymm11, ymm14, 7
vpslld ymm12, ymm14, 25
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 18
vpslld ymm13, ymm14, 14
vpor ymm12, ymm13, ymm12
vpsrld ymm13, ymm14, 3
vpxor ymm11, ymm11, ymm13
vpxor ymm11, ymm11, ymm12
vpaddd ymm11, ymm11, ymm15
vpaddd ymm11, ymm11, ymmword ptr [rsp + 224] ## 32-byte Folded Reload
vpaddd ymm11, ymm11, ymm7
vpsrld ymm7, ymm8, 6
vpslld ymm12, ymm8, 26
vpor ymm7, ymm12, ymm7
vpsrld ymm12, ymm8, 11
vpslld ymm13, ymm8, 21
vpor ymm12, ymm13, ymm12
vpxor ymm7, ymm12, ymm7
vpsrld ymm12, ymm8, 25
vpslld ymm13, ymm8, 7
vpor ymm12, ymm13, ymm12
vpxor ymm7, ymm7, ymm12
vpand ymm12, ymm8, ymm5
vpandn ymm13, ymm8, ymm2
vpxor ymm12, ymm12, ymm13
vpaddd ymm1, ymm11, ymm1
vpaddd ymm1, ymm1, ymm12
vpbroadcastd ymm12, dword ptr [rip + LCPI2_60] ## ymm12 = [2361852424,2361852424,2361852424,2361852424,2361852424,2361852424,2361852424,2361852424]
vpaddd ymm1, ymm1, ymm12
vpaddd ymm12, ymm7, ymm1
vpsrld ymm1, ymm3, 2
vpslld ymm7, ymm3, 30
vpor ymm1, ymm7, ymm1
vpsrld ymm7, ymm3, 13
vpslld ymm13, ymm3, 19
vpor ymm7, ymm13, ymm7
vpxor ymm1, ymm7, ymm1
vpsrld ymm7, ymm3, 22
vpslld ymm13, ymm3, 10
vpor ymm7, ymm13, ymm7
vpxor ymm1, ymm1, ymm7
vpand ymm7, ymm3, ymm9
vpxor ymm0, ymm7, ymm0
vpand ymm13, ymm3, ymm4
vpxor ymm0, ymm0, ymm13
vpaddd ymm0, ymm1, ymm0
vpaddd ymm1, ymm12, ymm6
vpaddd ymm0, ymm0, ymm12
vpsrld ymm6, ymm10, 17
vpslld ymm12, ymm10, 15
vpor ymm6, ymm12, ymm6
vpsrld ymm12, ymm10, 19
vpslld ymm13, ymm10, 13
vpor ymm12, ymm13, ymm12
vpsrld ymm10, ymm10, 10
vpxor ymm6, ymm6, ymm10
vpxor ymm6, ymm6, ymm12
vmovdqa ymm15, ymmword ptr [rsp + 512] ## 32-byte Reload
vpsrld ymm10, ymm15, 7
vpslld ymm12, ymm15, 25
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm15, 18
vpslld ymm13, ymm15, 14
vpor ymm12, ymm13, ymm12
vpsrld ymm13, ymm15, 3
vpxor ymm10, ymm10, ymm13
vpxor ymm10, ymm10, ymm12
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp + 288] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymm6
vpsrld ymm6, ymm1, 6
vpslld ymm12, ymm1, 26
vpor ymm6, ymm12, ymm6
vpsrld ymm12, ymm1, 11
vpslld ymm13, ymm1, 21
vpor ymm12, ymm13, ymm12
vpxor ymm6, ymm12, ymm6
vpsrld ymm12, ymm1, 25
vpslld ymm13, ymm1, 7
vpor ymm12, ymm13, ymm12
vpxor ymm6, ymm6, ymm12
vpand ymm12, ymm1, ymm8
vpandn ymm13, ymm1, ymm5
vpxor ymm12, ymm12, ymm13
vpaddd ymm2, ymm10, ymm2
vpaddd ymm2, ymm2, ymm12
vpbroadcastd ymm12, dword ptr [rip + LCPI2_61] ## ymm12 = [2428436474,2428436474,2428436474,2428436474,2428436474,2428436474,2428436474,2428436474]
vpaddd ymm2, ymm2, ymm12
vpaddd ymm12, ymm6, ymm2
vpsrld ymm2, ymm0, 2
vpslld ymm6, ymm0, 30
vpor ymm2, ymm6, ymm2
vpsrld ymm6, ymm0, 13
vpslld ymm13, ymm0, 19
vpor ymm6, ymm13, ymm6
vpxor ymm2, ymm6, ymm2
vpsrld ymm6, ymm0, 22
vpslld ymm13, ymm0, 10
vpor ymm6, ymm13, ymm6
vpxor ymm2, ymm2, ymm6
vpand ymm6, ymm0, ymm3
vpxor ymm7, ymm6, ymm7
vpand ymm13, ymm0, ymm9
vpxor ymm7, ymm7, ymm13
vpaddd ymm7, ymm2, ymm7
vpaddd ymm2, ymm12, ymm4
vpaddd ymm4, ymm7, ymm12
vpsrld ymm7, ymm11, 17
vpslld ymm12, ymm11, 15
vpor ymm7, ymm12, ymm7
vpsrld ymm12, ymm11, 19
vpslld ymm13, ymm11, 13
vpor ymm12, ymm13, ymm12
vpsrld ymm11, ymm11, 10
vpxor ymm7, ymm7, ymm11
vpxor ymm7, ymm7, ymm12
vmovdqa ymm14, ymmword ptr [rsp + 32] ## 32-byte Reload
vpsrld ymm11, ymm14, 7
vpslld ymm12, ymm14, 25
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm14, 18
vpslld ymm13, ymm14, 14
vpor ymm12, ymm13, ymm12
vpsrld ymm13, ymm14, 3
vpxor ymm11, ymm11, ymm13
vpxor ymm11, ymm11, ymm12
vpaddd ymm11, ymm11, ymm15
vpaddd ymm11, ymm11, ymmword ptr [rsp + 352] ## 32-byte Folded Reload
vpaddd ymm11, ymm11, ymm7
vpsrld ymm7, ymm2, 6
vpslld ymm12, ymm2, 26
vpor ymm7, ymm12, ymm7
vpsrld ymm12, ymm2, 11
vpslld ymm13, ymm2, 21
vpor ymm12, ymm13, ymm12
vpxor ymm7, ymm12, ymm7
vpsrld ymm12, ymm2, 25
vpslld ymm13, ymm2, 7
vpor ymm12, ymm13, ymm12
vpxor ymm7, ymm7, ymm12
vpand ymm12, ymm2, ymm1
vpandn ymm13, ymm2, ymm8
vpxor ymm12, ymm12, ymm13
vpaddd ymm5, ymm11, ymm5
vpaddd ymm5, ymm5, ymm12
vpbroadcastd ymm12, dword ptr [rip + LCPI2_62] ## ymm12 = [2756734187,2756734187,2756734187,2756734187,2756734187,2756734187,2756734187,2756734187]
vpaddd ymm5, ymm5, ymm12
vpaddd ymm12, ymm7, ymm5
vpsrld ymm5, ymm4, 2
vpslld ymm7, ymm4, 30
vpor ymm5, ymm7, ymm5
vpsrld ymm7, ymm4, 13
vpslld ymm13, ymm4, 19
vpor ymm7, ymm13, ymm7
vpxor ymm5, ymm7, ymm5
vpsrld ymm7, ymm4, 22
vpslld ymm13, ymm4, 10
vpor ymm7, ymm13, ymm7
vpxor ymm5, ymm5, ymm7
vpand ymm7, ymm4, ymm0
vpxor ymm6, ymm7, ymm6
vpand ymm13, ymm4, ymm3
vpxor ymm6, ymm6, ymm13
vpaddd ymm6, ymm5, ymm6
vpaddd ymm5, ymm12, ymm9
vpaddd ymm6, ymm6, ymm12
vpsrld ymm9, ymm10, 17
vpslld ymm12, ymm10, 15
vpor ymm9, ymm12, ymm9
vpsrld ymm12, ymm10, 19
vpslld ymm13, ymm10, 13
vpor ymm12, ymm13, ymm12
vpsrld ymm10, ymm10, 10
vpxor ymm9, ymm9, ymm10
vpxor ymm9, ymm9, ymm12
vmovdqa ymm14, ymmword ptr [rsp + 160] ## 32-byte Reload
vpsrld ymm10, ymm14, 7
vpslld ymm12, ymm14, 25
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm14, 18
vpslld ymm13, ymm14, 14
vpor ymm12, ymm13, ymm12
vpsrld ymm13, ymm14, 3
vpxor ymm10, ymm10, ymm13
vpxor ymm10, ymm10, ymm12
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload
vpaddd ymm10, ymm10, ymmword ptr [rsp + 64] ## 32-byte Folded Reload
vpaddd ymm9, ymm10, ymm9
vpsrld ymm10, ymm5, 6
vpslld ymm12, ymm5, 26
vpor ymm10, ymm12, ymm10
vpsrld ymm12, ymm5, 11
vpslld ymm13, ymm5, 21
vpor ymm12, ymm13, ymm12
vpxor ymm10, ymm12, ymm10
vpsrld ymm12, ymm5, 25
vpslld ymm13, ymm5, 7
vpor ymm12, ymm13, ymm12
vpxor ymm10, ymm10, ymm12
vpand ymm12, ymm5, ymm2
vpandn ymm13, ymm5, ymm1
vpxor ymm12, ymm12, ymm13
vpaddd ymm8, ymm9, ymm8
vpaddd ymm8, ymm8, ymm12
vpbroadcastd ymm9, dword ptr [rip + LCPI2_63] ## ymm9 = [3204031479,3204031479,3204031479,3204031479,3204031479,3204031479,3204031479,3204031479]
vpaddd ymm8, ymm8, ymm9
vpaddd ymm9, ymm10, ymm8
vpsrld ymm8, ymm6, 2
vpslld ymm10, ymm6, 30
vpor ymm8, ymm10, ymm8
vpsrld ymm10, ymm6, 13
vpslld ymm12, ymm6, 19
vpor ymm10, ymm12, ymm10
vpxor ymm8, ymm10, ymm8
vpsrld ymm10, ymm6, 22
vpslld ymm12, ymm6, 10
vpor ymm10, ymm12, ymm10
vpxor ymm10, ymm8, ymm10
vpand ymm8, ymm6, ymm4
vpxor ymm7, ymm8, ymm7
vpand ymm12, ymm6, ymm0
vpxor ymm7, ymm7, ymm12
vpaddd ymm7, ymm10, ymm7
vpaddd ymm3, ymm9, ymm3
vpaddd ymm7, ymm7, ymm9
vpsrld ymm9, ymm11, 17
vpslld ymm10, ymm11, 15
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm11, 19
vpslld ymm12, ymm11, 13
vpor ymm10, ymm12, ymm10
vpsrld ymm11, ymm11, 10
vpxor ymm9, ymm9, ymm11
vpxor ymm9, ymm9, ymm10
vmovdqa ymm13, ymmword ptr [rsp + 320] ## 32-byte Reload
vpsrld ymm10, ymm13, 7
vpslld ymm11, ymm13, 25
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm13, 18
vpslld ymm12, ymm13, 14
vpor ymm11, ymm12, ymm11
vpsrld ymm12, ymm13, 3
vpxor ymm10, ymm10, ymm12
vpxor ymm10, ymm10, ymm11
vpaddd ymm10, ymm10, ymm14
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload
vpaddd ymm9, ymm10, ymm9
vpsrld ymm10, ymm3, 6
vpslld ymm11, ymm3, 26
vpor ymm10, ymm11, ymm10
vpsrld ymm11, ymm3, 11
vpslld ymm12, ymm3, 21
vpor ymm11, ymm12, ymm11
vpxor ymm10, ymm11, ymm10
vpsrld ymm11, ymm3, 25
vpslld ymm12, ymm3, 7
vpor ymm11, ymm12, ymm11
vpxor ymm10, ymm10, ymm11
vpand ymm11, ymm3, ymm5
vpandn ymm12, ymm3, ymm2
vpxor ymm11, ymm11, ymm12
vpaddd ymm1, ymm9, ymm1
vpaddd ymm1, ymm1, ymm11
vpbroadcastd ymm9, dword ptr [rip + LCPI2_64] ## ymm9 = [3329325298,3329325298,3329325298,3329325298,3329325298,3329325298,3329325298,3329325298]
vpaddd ymm1, ymm1, ymm9
vpaddd ymm1, ymm10, ymm1
vpsrld ymm9, ymm7, 2
vpslld ymm10, ymm7, 30
vpor ymm9, ymm10, ymm9
vpsrld ymm10, ymm7, 13
vpslld ymm11, ymm7, 19
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm10, ymm9
vpsrld ymm10, ymm7, 22
vpslld ymm11, ymm7, 10
vpor ymm10, ymm11, ymm10
vpxor ymm9, ymm9, ymm10
vpxor ymm10, ymm6, ymm4
vpand ymm10, ymm7, ymm10
vpxor ymm8, ymm10, ymm8
vpaddd ymm8, ymm8, ymmword ptr [rsp + 640] ## 32-byte Folded Reload
vpaddd ymm8, ymm8, ymm9
vpaddd ymm8, ymm8, ymm1
vextracti128 xmmword ptr [rdi + 16], ymm8, 1
vmovdqa xmmword ptr [rdi], xmm8
vpaddd ymm7, ymm7, ymmword ptr [rsp + 704] ## 32-byte Folded Reload
vextracti128 xmmword ptr [rdi + 48], ymm7, 1
vmovdqa xmmword ptr [rdi + 32], xmm7
vpaddd ymm6, ymm6, ymmword ptr [rsp + 768] ## 32-byte Folded Reload
vextracti128 xmmword ptr [rdi + 80], ymm6, 1
vmovdqa xmmword ptr [rdi + 64], xmm6
vpaddd ymm4, ymm4, ymmword ptr [rsp + 832] ## 32-byte Folded Reload
vextracti128 xmmword ptr [rdi + 112], ymm4, 1
vmovdqa xmmword ptr [rdi + 96], xmm4
vpaddd ymm0, ymm0, ymmword ptr [rsp + 672] ## 32-byte Folded Reload
vpaddd ymm0, ymm0, ymm1
vextracti128 xmmword ptr [rdi + 144], ymm0, 1
vmovdqa xmmword ptr [rdi + 128], xmm0
vpaddd ymm0, ymm3, ymmword ptr [rsp + 736] ## 32-byte Folded Reload
vextracti128 xmmword ptr [rdi + 176], ymm0, 1
vmovdqa xmmword ptr [rdi + 160], xmm0
vpaddd ymm0, ymm5, ymmword ptr [rsp + 800] ## 32-byte Folded Reload
vextracti128 xmmword ptr [rdi + 208], ymm0, 1
vmovdqa xmmword ptr [rdi + 192], xmm0
vpaddd ymm0, ymm2, ymmword ptr [rsp + 864] ## 32-byte Folded Reload
vextracti128 xmmword ptr [rdi + 240], ymm0, 1
vmovdqa xmmword ptr [rdi + 224], xmm0
mov rax, qword ptr [rip + ___stack_chk_guard@GOTPCREL]
mov rax, qword ptr [rax]
cmp rax, qword ptr [rsp + 2952]
jne LBB2_4
## BB#3:
mov rsp, rbp
pop rbp
vzeroupper
ret
LBB2_4:
vzeroupper
call ___stack_chk_fail
## -- End function
.section __TEXT,__const
.p2align 5 ## -- Begin function Sha256Final8x
LCPI3_0:
.byte 3 ## 0x3
.byte 2 ## 0x2
.byte 1 ## 0x1
.byte 0 ## 0x0
.byte 7 ## 0x7
.byte 6 ## 0x6
.byte 5 ## 0x5
.byte 4 ## 0x4
.byte 11 ## 0xb
.byte 10 ## 0xa
.byte 9 ## 0x9
.byte 8 ## 0x8
.byte 15 ## 0xf
.byte 14 ## 0xe
.byte 13 ## 0xd
.byte 12 ## 0xc
.byte 3 ## 0x3
.byte 2 ## 0x2
.byte 1 ## 0x1
.byte 0 ## 0x0
.byte 7 ## 0x7
.byte 6 ## 0x6
.byte 5 ## 0x5
.byte 4 ## 0x4
.byte 11 ## 0xb
.byte 10 ## 0xa
.byte 9 ## 0x9
.byte 8 ## 0x8
.byte 15 ## 0xf
.byte 14 ## 0xe
.byte 13 ## 0xd
.byte 12 ## 0xc
.section __TEXT,__text,regular,pure_instructions
.globl _Sha256Final8x
_Sha256Final8x: ## @Sha256Final8x
## BB#0:
push rbp
mov rbp, rsp
push r15
push r14
push r13
push r12
push rbx
and rsp, -16
sub rsp, 16
mov qword ptr [rsp], r9 ## 8-byte Spill
mov r15, r8
mov r12, rcx
mov r13, rdx
mov r14, rsi
mov rbx, rdi
mov eax, dword ptr [rbx + 768]
xor ecx, ecx
xor edx, edx
cmp eax, 56
jl LBB3_5
jmp LBB3_1
LBB3_8: ## in Loop: Header=BB3_5 Depth=1
mov eax, dword ptr [rbx + 768]
add ecx, 64
LBB3_5: ## =>This Loop Header: Depth=1
## Child Loop BB3_6 Depth 2
mov sil, -128
LBB3_6: ## Parent Loop BB3_5 Depth=1
## => This Inner Loop Header: Depth=2
lea edi, [rcx + rax]
inc eax
mov byte ptr [rbx + rdi + 256], sil
xor esi, esi
cmp eax, 64
jb LBB3_6
## BB#7: ## in Loop: Header=BB3_5 Depth=1
inc edx
cmp edx, 8
jne LBB3_8
jmp LBB3_10
LBB3_4: ## in Loop: Header=BB3_1 Depth=1
mov eax, dword ptr [rbx + 768]
add ecx, 64
LBB3_1: ## =>This Loop Header: Depth=1
## Child Loop BB3_2 Depth 2
mov sil, -128
LBB3_2: ## Parent Loop BB3_1 Depth=1
## => This Inner Loop Header: Depth=2
lea edi, [rcx + rax]
inc eax
mov byte ptr [rbx + rdi + 256], sil
xor esi, esi
cmp eax, 64
jb LBB3_2
## BB#3: ## in Loop: Header=BB3_1 Depth=1
inc edx
cmp edx, 8
jne LBB3_4
## BB#9:
lea rsi, [rbx + 256]
mov rdi, rbx
call _sha256_transform8x
vxorps xmm0, xmm0, xmm0
vmovups xmmword ptr [rbx + 272], xmm0
vmovups xmmword ptr [rbx + 256], xmm0
vmovups xmmword ptr [rbx + 304], xmm0
vmovups xmmword ptr [rbx + 288], xmm0
vmovups xmmword ptr [rbx + 336], xmm0
vmovups xmmword ptr [rbx + 320], xmm0
vmovups xmmword ptr [rbx + 368], xmm0
vmovups xmmword ptr [rbx + 352], xmm0
vmovups xmmword ptr [rbx + 400], xmm0
vmovups xmmword ptr [rbx + 384], xmm0
vmovups xmmword ptr [rbx + 432], xmm0
vmovups xmmword ptr [rbx + 416], xmm0
vmovups xmmword ptr [rbx + 464], xmm0
vmovups xmmword ptr [rbx + 448], xmm0
vmovups xmmword ptr [rbx + 496], xmm0
vmovups xmmword ptr [rbx + 480], xmm0
vmovups xmmword ptr [rbx + 528], xmm0
vmovups xmmword ptr [rbx + 512], xmm0
vmovups xmmword ptr [rbx + 560], xmm0
vmovups xmmword ptr [rbx + 544], xmm0
vmovups xmmword ptr [rbx + 592], xmm0
vmovups xmmword ptr [rbx + 576], xmm0
vmovups xmmword ptr [rbx + 624], xmm0
vmovups xmmword ptr [rbx + 608], xmm0
vmovups xmmword ptr [rbx + 656], xmm0
vmovups xmmword ptr [rbx + 640], xmm0
vmovups xmmword ptr [rbx + 688], xmm0
vmovups xmmword ptr [rbx + 672], xmm0
LBB3_10:
movsxd r11, dword ptr [rbx + 768]
shl r11, 3
add r11, qword ptr [rbx + 776]
mov qword ptr [rbx + 776], r11
mov r8, r11
shr r8, 8
mov r9, r11
shr r9, 16
mov r10, r11
shr r10, 24
mov rdi, r11
shr rdi, 32
mov rax, r11
shr rax, 40
mov rcx, r11
shr rcx, 48
mov rdx, r11
shr rdx, 56
mov esi, 319
LBB3_11: ## =>This Inner Loop Header: Depth=1
mov byte ptr [rbx + rsi], r11b
mov byte ptr [rbx + rsi - 1], r8b
mov byte ptr [rbx + rsi - 2], r9b
mov byte ptr [rbx + rsi - 3], r10b
mov byte ptr [rbx + rsi - 4], dil
mov byte ptr [rbx + rsi - 5], al
mov byte ptr [rbx + rsi - 6], cl
mov byte ptr [rbx + rsi - 7], dl
add rsi, 64
cmp rsi, 831
jne LBB3_11
## BB#12:
lea rsi, [rbx + 256]
mov rdi, rbx
call _sha256_transform8x
vmovdqa xmm0, xmmword ptr [rbx]
vmovdqa xmm1, xmmword ptr [rbx + 32]
vmovdqa xmm2, xmmword ptr [rbx + 64]
vmovdqa xmm3, xmmword ptr [rbx + 96]
vinserti128 ymm0, ymm0, xmmword ptr [rbx + 16], 1
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 48], 1
vpunpckldq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5]
vpunpckhdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7]
vinserti128 ymm1, ymm2, xmmword ptr [rbx + 80], 1
vinserti128 ymm2, ymm3, xmmword ptr [rbx + 112], 1
vpunpckldq ymm3, ymm1, ymm2 ## ymm3 = ymm1[0],ymm2[0],ymm1[1],ymm2[1],ymm1[4],ymm2[4],ymm1[5],ymm2[5]
vpunpckhdq ymm1, ymm1, ymm2 ## ymm1 = ymm1[2],ymm2[2],ymm1[3],ymm2[3],ymm1[6],ymm2[6],ymm1[7],ymm2[7]
vmovdqa xmm2, xmmword ptr [rbx + 128]
vinserti128 ymm2, ymm2, xmmword ptr [rbx + 144], 1
vmovdqa xmm5, xmmword ptr [rbx + 160]
vinserti128 ymm5, ymm5, xmmword ptr [rbx + 176], 1
vpunpckldq ymm6, ymm2, ymm5 ## ymm6 = ymm2[0],ymm5[0],ymm2[1],ymm5[1],ymm2[4],ymm5[4],ymm2[5],ymm5[5]
vpunpckhdq ymm2, ymm2, ymm5 ## ymm2 = ymm2[2],ymm5[2],ymm2[3],ymm5[3],ymm2[6],ymm5[6],ymm2[7],ymm5[7]
vmovdqa xmm5, xmmword ptr [rbx + 192]
vinserti128 ymm5, ymm5, xmmword ptr [rbx + 208], 1
vmovdqa xmm7, xmmword ptr [rbx + 224]
vinserti128 ymm7, ymm7, xmmword ptr [rbx + 240], 1
vpunpckldq ymm8, ymm5, ymm7 ## ymm8 = ymm5[0],ymm7[0],ymm5[1],ymm7[1],ymm5[4],ymm7[4],ymm5[5],ymm7[5]
vpunpckhdq ymm5, ymm5, ymm7 ## ymm5 = ymm5[2],ymm7[2],ymm5[3],ymm7[3],ymm5[6],ymm7[6],ymm5[7],ymm7[7]
vpunpcklqdq ymm7, ymm4, ymm3 ## ymm7 = ymm4[0],ymm3[0],ymm4[2],ymm3[2]
vpunpckhqdq ymm3, ymm4, ymm3 ## ymm3 = ymm4[1],ymm3[1],ymm4[3],ymm3[3]
vpunpcklqdq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[2],ymm1[2]
vpunpckhqdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3]
vpunpcklqdq ymm9, ymm6, ymm8 ## ymm9 = ymm6[0],ymm8[0],ymm6[2],ymm8[2]
vpunpckhqdq ymm6, ymm6, ymm8 ## ymm6 = ymm6[1],ymm8[1],ymm6[3],ymm8[3]
vpunpcklqdq ymm8, ymm2, ymm5 ## ymm8 = ymm2[0],ymm5[0],ymm2[2],ymm5[2]
vpunpckhqdq ymm2, ymm2, ymm5 ## ymm2 = ymm2[1],ymm5[1],ymm2[3],ymm5[3]
vinserti128 ymm1, ymm7, xmm9, 1
vmovdqa xmmword ptr [rbx + 16], xmm9
vmovdqa xmmword ptr [rbx], xmm7
vmovdqa xmmword ptr [rbx + 48], xmm6
vmovdqa xmmword ptr [rbx + 32], xmm3
vmovdqa xmmword ptr [rbx + 80], xmm8
vmovdqa xmmword ptr [rbx + 64], xmm4
vmovdqa xmmword ptr [rbx + 112], xmm2
vmovdqa xmmword ptr [rbx + 96], xmm0
vperm2i128 ymm5, ymm7, ymm9, 49 ## ymm5 = ymm7[2,3],ymm9[2,3]
vextracti128 xmmword ptr [rbx + 144], ymm5, 1
vmovdqa xmmword ptr [rbx + 128], xmm5
vperm2i128 ymm3, ymm3, ymm6, 49 ## ymm3 = ymm3[2,3],ymm6[2,3]
vextracti128 xmmword ptr [rbx + 176], ymm3, 1
vmovdqa xmmword ptr [rbx + 160], xmm3
vperm2i128 ymm3, ymm4, ymm8, 49 ## ymm3 = ymm4[2,3],ymm8[2,3]
vextracti128 xmmword ptr [rbx + 208], ymm3, 1
vmovdqa xmmword ptr [rbx + 192], xmm3
vperm2i128 ymm0, ymm0, ymm2, 49 ## ymm0 = ymm0[2,3],ymm2[2,3]
vextracti128 xmmword ptr [rbx + 240], ymm0, 1
vmovdqa xmmword ptr [rbx + 224], xmm0
vmovdqa ymm0, ymmword ptr [rip + LCPI3_0] ## ymm0 = [3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12,3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]
vpshufb ymm1, ymm1, ymm0
vextracti128 xmmword ptr [r14 + 16], ymm1, 1
vmovdqu xmmword ptr [r14], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 32]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 48], 1
vpshufb ymm1, ymm1, ymm0
vextracti128 xmmword ptr [r13 + 16], ymm1, 1
vmovdqu xmmword ptr [r13], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 64]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 80], 1
vpshufb ymm1, ymm1, ymm0
vextracti128 xmmword ptr [r12 + 16], ymm1, 1
vmovdqu xmmword ptr [r12], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 96]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 112], 1
vpshufb ymm1, ymm1, ymm0
vextracti128 xmmword ptr [r15 + 16], ymm1, 1
vmovdqu xmmword ptr [r15], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 128]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 144], 1
vpshufb ymm1, ymm1, ymm0
mov rax, qword ptr [rsp] ## 8-byte Reload
vextracti128 xmmword ptr [rax + 16], ymm1, 1
vmovdqu xmmword ptr [rax], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 160]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 176], 1
vpshufb ymm1, ymm1, ymm0
mov rax, qword ptr [rbp + 16]
vextracti128 xmmword ptr [rax + 16], ymm1, 1
vmovdqu xmmword ptr [rax], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 192]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 208], 1
vpshufb ymm1, ymm1, ymm0
mov rax, qword ptr [rbp + 24]
vextracti128 xmmword ptr [rax + 16], ymm1, 1
vmovdqu xmmword ptr [rax], xmm1
vmovdqa xmm1, xmmword ptr [rbx + 224]
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 240], 1
vpshufb ymm0, ymm1, ymm0
mov rax, qword ptr [rbp + 32]
vextracti128 xmmword ptr [rax + 16], ymm0, 1
vmovdqu xmmword ptr [rax], xmm0
lea rsp, [rbp - 40]
pop rbx
pop r12
pop r13
pop r14
pop r15
pop rbp
vzeroupper
ret
## -- End function
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment