Created
June 6, 2018 08:22
-
-
Save bwesterb/1daba528b15e1073498a16e2ab34672a to your computer and use it in GitHub Desktop.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
.section __TEXT,__text,regular,pure_instructions | |
.macosx_version_min 10, 13 | |
.intel_syntax noprefix | |
.section __TEXT,__literal8,8byte_literals | |
.p2align 3 ## -- Begin function Sha256Init8x | |
LCPI0_0: | |
.quad 7640891574645810791 ## 0x6a09e6676a09e667 | |
LCPI0_1: | |
.quad -4942790176617812347 ## 0xbb67ae85bb67ae85 | |
LCPI0_2: | |
.quad 4354685561679573874 ## 0x3c6ef3723c6ef372 | |
LCPI0_3: | |
.quad -6534734902060911302 ## 0xa54ff53aa54ff53a | |
LCPI0_4: | |
.quad 5840696473520329343 ## 0x510e527f510e527f | |
LCPI0_5: | |
.quad -7276294669841635188 ## 0x9b05688c9b05688c | |
LCPI0_6: | |
.quad 2270897966116231595 ## 0x1f83d9ab1f83d9ab | |
LCPI0_7: | |
.quad 6620516961033964825 ## 0x5be0cd195be0cd19 | |
.section __TEXT,__text,regular,pure_instructions | |
.globl _Sha256Init8x | |
_Sha256Init8x: ## @Sha256Init8x | |
## BB#0: | |
push rbp | |
mov rbp, rsp | |
and rsp, -8 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_0] ## xmm0 = [7640891574645810791,7640891574645810791] | |
vmovdqa xmmword ptr [rdi + 16], xmm0 | |
vmovdqa xmmword ptr [rdi], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_1] ## xmm0 = [13503953897091739269,13503953897091739269] | |
vmovdqa xmmword ptr [rdi + 48], xmm0 | |
vmovdqa xmmword ptr [rdi + 32], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_2] ## xmm0 = [4354685561679573874,4354685561679573874] | |
vmovdqa xmmword ptr [rdi + 80], xmm0 | |
vmovdqa xmmword ptr [rdi + 64], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_3] ## xmm0 = [11912009171648640314,11912009171648640314] | |
vmovdqa xmmword ptr [rdi + 112], xmm0 | |
vmovdqa xmmword ptr [rdi + 96], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_4] ## xmm0 = [5840696473520329343,5840696473520329343] | |
vmovdqa xmmword ptr [rdi + 144], xmm0 | |
vmovdqa xmmword ptr [rdi + 128], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_5] ## xmm0 = [11170449403867916428,11170449403867916428] | |
vmovdqa xmmword ptr [rdi + 176], xmm0 | |
vmovdqa xmmword ptr [rdi + 160], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_6] ## xmm0 = [2270897966116231595,2270897966116231595] | |
vmovdqa xmmword ptr [rdi + 208], xmm0 | |
vmovdqa xmmword ptr [rdi + 192], xmm0 | |
vpbroadcastq xmm0, qword ptr [rip + LCPI0_7] ## xmm0 = [6620516961033964825,6620516961033964825] | |
vmovdqa xmmword ptr [rdi + 240], xmm0 | |
vmovdqa xmmword ptr [rdi + 224], xmm0 | |
mov dword ptr [rdi + 768], 0 | |
mov qword ptr [rdi + 776], 0 | |
mov rsp, rbp | |
pop rbp | |
ret | |
## -- End function | |
.globl _Sha256Update8x ## -- Begin function Sha256Update8x | |
_Sha256Update8x: ## @Sha256Update8x | |
## BB#0: | |
push rbp | |
mov rbp, rsp | |
push r15 | |
push r14 | |
push r13 | |
push r12 | |
push rbx | |
and rsp, -16 | |
sub rsp, 112 | |
mov qword ptr [rsp + 96], r9 ## 8-byte Spill | |
mov qword ptr [rsp + 88], r8 ## 8-byte Spill | |
mov qword ptr [rsp + 80], rcx ## 8-byte Spill | |
mov qword ptr [rsp + 72], rdx ## 8-byte Spill | |
mov qword ptr [rsp + 64], rsi ## 8-byte Spill | |
mov r14, rdi | |
mov rbx, qword ptr [rbp + 40] | |
test rbx, rbx | |
je LBB1_5 | |
## BB#1: | |
lea r15, [r14 + 256] | |
lea rax, [r14 + 320] | |
mov qword ptr [rsp + 56], rax ## 8-byte Spill | |
lea rax, [r14 + 384] | |
mov qword ptr [rsp + 48], rax ## 8-byte Spill | |
lea rax, [r14 + 448] | |
mov qword ptr [rsp + 40], rax ## 8-byte Spill | |
lea rax, [r14 + 512] | |
mov qword ptr [rsp + 32], rax ## 8-byte Spill | |
lea rax, [r14 + 576] | |
mov qword ptr [rsp + 24], rax ## 8-byte Spill | |
lea rax, [r14 + 640] | |
mov qword ptr [rsp + 16], rax ## 8-byte Spill | |
lea rax, [r14 + 704] | |
mov qword ptr [rsp + 8], rax ## 8-byte Spill | |
xor r13d, r13d | |
LBB1_2: ## =>This Inner Loop Header: Depth=1 | |
mov r12, r13 | |
mov r13, rbx | |
sub r13, r12 | |
mov eax, 64 | |
cmp r13, rax | |
cmovae r13, rax | |
mov rax, qword ptr [rsp + 64] ## 8-byte Reload | |
lea rsi, [rax + r12] | |
mov rdi, r15 | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rsp + 72] ## 8-byte Reload | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 56] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rsp + 80] ## 8-byte Reload | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 48] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rsp + 88] ## 8-byte Reload | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 40] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rsp + 96] ## 8-byte Reload | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 32] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rbp + 16] | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 24] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rbp + 24] | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 16] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov rax, qword ptr [rbp + 32] | |
lea rsi, [rax + r12] | |
mov rdi, qword ptr [rsp + 8] ## 8-byte Reload | |
mov rdx, r13 | |
call _memcpy | |
mov eax, dword ptr [r14 + 768] | |
add eax, r13d | |
mov dword ptr [r14 + 768], eax | |
add r13, r12 | |
cmp eax, 64 | |
jne LBB1_4 | |
## BB#3: ## in Loop: Header=BB1_2 Depth=1 | |
mov rdi, r14 | |
mov rsi, r15 | |
call _sha256_transform8x | |
add qword ptr [r14 + 776], 512 | |
mov dword ptr [r14 + 768], 0 | |
LBB1_4: ## in Loop: Header=BB1_2 Depth=1 | |
cmp r13, rbx | |
jb LBB1_2 | |
LBB1_5: | |
lea rsp, [rbp - 40] | |
pop rbx | |
pop r12 | |
pop r13 | |
pop r14 | |
pop r15 | |
pop rbp | |
ret | |
## -- End function | |
.section __TEXT,__const | |
.p2align 5 ## -- Begin function sha256_transform8x | |
LCPI2_0: | |
.byte 3 ## 0x3 | |
.byte 2 ## 0x2 | |
.byte 1 ## 0x1 | |
.byte 0 ## 0x0 | |
.byte 7 ## 0x7 | |
.byte 6 ## 0x6 | |
.byte 5 ## 0x5 | |
.byte 4 ## 0x4 | |
.byte 11 ## 0xb | |
.byte 10 ## 0xa | |
.byte 9 ## 0x9 | |
.byte 8 ## 0x8 | |
.byte 15 ## 0xf | |
.byte 14 ## 0xe | |
.byte 13 ## 0xd | |
.byte 12 ## 0xc | |
.byte 3 ## 0x3 | |
.byte 2 ## 0x2 | |
.byte 1 ## 0x1 | |
.byte 0 ## 0x0 | |
.byte 7 ## 0x7 | |
.byte 6 ## 0x6 | |
.byte 5 ## 0x5 | |
.byte 4 ## 0x4 | |
.byte 11 ## 0xb | |
.byte 10 ## 0xa | |
.byte 9 ## 0x9 | |
.byte 8 ## 0x8 | |
.byte 15 ## 0xf | |
.byte 14 ## 0xe | |
.byte 13 ## 0xd | |
.byte 12 ## 0xc | |
.section __TEXT,__literal4,4byte_literals | |
.p2align 2 | |
LCPI2_1: | |
.long 1116352408 ## 0x428a2f98 | |
LCPI2_2: | |
.long 1899447441 ## 0x71374491 | |
LCPI2_3: | |
.long 3049323471 ## 0xb5c0fbcf | |
LCPI2_4: | |
.long 3921009573 ## 0xe9b5dba5 | |
LCPI2_5: | |
.long 961987163 ## 0x3956c25b | |
LCPI2_6: | |
.long 1508970993 ## 0x59f111f1 | |
LCPI2_7: | |
.long 2453635748 ## 0x923f82a4 | |
LCPI2_8: | |
.long 2870763221 ## 0xab1c5ed5 | |
LCPI2_9: | |
.long 3624381080 ## 0xd807aa98 | |
LCPI2_10: | |
.long 310598401 ## 0x12835b01 | |
LCPI2_11: | |
.long 607225278 ## 0x243185be | |
LCPI2_12: | |
.long 1426881987 ## 0x550c7dc3 | |
LCPI2_13: | |
.long 1925078388 ## 0x72be5d74 | |
LCPI2_14: | |
.long 2162078206 ## 0x80deb1fe | |
LCPI2_15: | |
.long 2614888103 ## 0x9bdc06a7 | |
LCPI2_16: | |
.long 3248222580 ## 0xc19bf174 | |
LCPI2_17: | |
.long 3835390401 ## 0xe49b69c1 | |
LCPI2_18: | |
.long 4022224774 ## 0xefbe4786 | |
LCPI2_19: | |
.long 264347078 ## 0xfc19dc6 | |
LCPI2_20: | |
.long 604807628 ## 0x240ca1cc | |
LCPI2_21: | |
.long 770255983 ## 0x2de92c6f | |
LCPI2_22: | |
.long 1249150122 ## 0x4a7484aa | |
LCPI2_23: | |
.long 1555081692 ## 0x5cb0a9dc | |
LCPI2_24: | |
.long 1996064986 ## 0x76f988da | |
LCPI2_25: | |
.long 2554220882 ## 0x983e5152 | |
LCPI2_26: | |
.long 2821834349 ## 0xa831c66d | |
LCPI2_27: | |
.long 2952996808 ## 0xb00327c8 | |
LCPI2_28: | |
.long 3210313671 ## 0xbf597fc7 | |
LCPI2_29: | |
.long 3336571891 ## 0xc6e00bf3 | |
LCPI2_30: | |
.long 3584528711 ## 0xd5a79147 | |
LCPI2_31: | |
.long 113926993 ## 0x6ca6351 | |
LCPI2_32: | |
.long 338241895 ## 0x14292967 | |
LCPI2_33: | |
.long 666307205 ## 0x27b70a85 | |
LCPI2_34: | |
.long 773529912 ## 0x2e1b2138 | |
LCPI2_35: | |
.long 1294757372 ## 0x4d2c6dfc | |
LCPI2_36: | |
.long 1396182291 ## 0x53380d13 | |
LCPI2_37: | |
.long 1695183700 ## 0x650a7354 | |
LCPI2_38: | |
.long 1986661051 ## 0x766a0abb | |
LCPI2_39: | |
.long 2177026350 ## 0x81c2c92e | |
LCPI2_40: | |
.long 2456956037 ## 0x92722c85 | |
LCPI2_41: | |
.long 2730485921 ## 0xa2bfe8a1 | |
LCPI2_42: | |
.long 2820302411 ## 0xa81a664b | |
LCPI2_43: | |
.long 3259730800 ## 0xc24b8b70 | |
LCPI2_44: | |
.long 3345764771 ## 0xc76c51a3 | |
LCPI2_45: | |
.long 3516065817 ## 0xd192e819 | |
LCPI2_46: | |
.long 3600352804 ## 0xd6990624 | |
LCPI2_47: | |
.long 4094571909 ## 0xf40e3585 | |
LCPI2_48: | |
.long 275423344 ## 0x106aa070 | |
LCPI2_49: | |
.long 430227734 ## 0x19a4c116 | |
LCPI2_50: | |
.long 506948616 ## 0x1e376c08 | |
LCPI2_51: | |
.long 659060556 ## 0x2748774c | |
LCPI2_52: | |
.long 883997877 ## 0x34b0bcb5 | |
LCPI2_53: | |
.long 958139571 ## 0x391c0cb3 | |
LCPI2_54: | |
.long 1322822218 ## 0x4ed8aa4a | |
LCPI2_55: | |
.long 1537002063 ## 0x5b9cca4f | |
LCPI2_56: | |
.long 1747873779 ## 0x682e6ff3 | |
LCPI2_57: | |
.long 1955562222 ## 0x748f82ee | |
LCPI2_58: | |
.long 2024104815 ## 0x78a5636f | |
LCPI2_59: | |
.long 2227730452 ## 0x84c87814 | |
LCPI2_60: | |
.long 2361852424 ## 0x8cc70208 | |
LCPI2_61: | |
.long 2428436474 ## 0x90befffa | |
LCPI2_62: | |
.long 2756734187 ## 0xa4506ceb | |
LCPI2_63: | |
.long 3204031479 ## 0xbef9a3f7 | |
LCPI2_64: | |
.long 3329325298 ## 0xc67178f2 | |
.section __TEXT,__text,regular,pure_instructions | |
_sha256_transform8x: ## @sha256_transform8x | |
## BB#0: | |
push rbp | |
mov rbp, rsp | |
and rsp, -32 | |
sub rsp, 2976 | |
mov rax, qword ptr [rip + ___stack_chk_guard@GOTPCREL] | |
mov rax, qword ptr [rax] | |
mov qword ptr [rsp + 2952], rax | |
xor eax, eax | |
vmovdqa ymm0, ymmword ptr [rip + LCPI2_0] ## ymm0 = [3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12,3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12] | |
LBB2_1: ## =>This Inner Loop Header: Depth=1 | |
vmovdqu xmm1, xmmword ptr [rsi + 2*rax] | |
vinserti128 ymm1, ymm1, xmmword ptr [rsi + 2*rax + 16], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
vmovdqa ymmword ptr [rsp + rax + 896], ymm1 | |
vmovdqu xmm1, xmmword ptr [rsi + 2*rax + 32] | |
vinserti128 ymm1, ymm1, xmmword ptr [rsi + 2*rax + 48], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
vmovdqa ymmword ptr [rsp + rax + 1152], ymm1 | |
add rax, 32 | |
cmp rax, 256 | |
jne LBB2_1 | |
## BB#2: | |
vmovdqa ymm0, ymmword ptr [rsp + 896] | |
vmovdqa ymm1, ymmword ptr [rsp + 928] | |
vmovdqa ymm2, ymmword ptr [rsp + 960] | |
vmovdqa ymm3, ymmword ptr [rsp + 992] | |
vpunpckldq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] | |
vpunpckhdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] | |
vpunpckldq ymm1, ymm2, ymm3 ## ymm1 = ymm2[0],ymm3[0],ymm2[1],ymm3[1],ymm2[4],ymm3[4],ymm2[5],ymm3[5] | |
vpunpckhdq ymm2, ymm2, ymm3 ## ymm2 = ymm2[2],ymm3[2],ymm2[3],ymm3[3],ymm2[6],ymm3[6],ymm2[7],ymm3[7] | |
vmovdqa ymm3, ymmword ptr [rsp + 1024] | |
vmovdqa ymm5, ymmword ptr [rsp + 1056] | |
vpunpckldq ymm6, ymm3, ymm5 ## ymm6 = ymm3[0],ymm5[0],ymm3[1],ymm5[1],ymm3[4],ymm5[4],ymm3[5],ymm5[5] | |
vpunpckhdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[2],ymm5[2],ymm3[3],ymm5[3],ymm3[6],ymm5[6],ymm3[7],ymm5[7] | |
vmovdqa ymm5, ymmword ptr [rsp + 1088] | |
vmovdqa ymm7, ymmword ptr [rsp + 1120] | |
vpunpckldq ymm8, ymm5, ymm7 ## ymm8 = ymm5[0],ymm7[0],ymm5[1],ymm7[1],ymm5[4],ymm7[4],ymm5[5],ymm7[5] | |
vpunpckhdq ymm5, ymm5, ymm7 ## ymm5 = ymm5[2],ymm7[2],ymm5[3],ymm7[3],ymm5[6],ymm7[6],ymm5[7],ymm7[7] | |
vpunpcklqdq ymm7, ymm4, ymm1 ## ymm7 = ymm4[0],ymm1[0],ymm4[2],ymm1[2] | |
vpunpckhqdq ymm1, ymm4, ymm1 ## ymm1 = ymm4[1],ymm1[1],ymm4[3],ymm1[3] | |
vpunpcklqdq ymm4, ymm0, ymm2 ## ymm4 = ymm0[0],ymm2[0],ymm0[2],ymm2[2] | |
vpunpckhqdq ymm0, ymm0, ymm2 ## ymm0 = ymm0[1],ymm2[1],ymm0[3],ymm2[3] | |
vpunpcklqdq ymm2, ymm6, ymm8 ## ymm2 = ymm6[0],ymm8[0],ymm6[2],ymm8[2] | |
vpunpckhqdq ymm6, ymm6, ymm8 ## ymm6 = ymm6[1],ymm8[1],ymm6[3],ymm8[3] | |
vpunpcklqdq ymm8, ymm3, ymm5 ## ymm8 = ymm3[0],ymm5[0],ymm3[2],ymm5[2] | |
vpunpckhqdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[1],ymm5[1],ymm3[3],ymm5[3] | |
vinserti128 ymm5, ymm7, xmm2, 1 | |
vmovdqa ymmword ptr [rsp + 896], ymm5 | |
vmovdqa ymm9, ymm5 | |
vmovdqa ymmword ptr [rsp + 192], ymm9 ## 32-byte Spill | |
vinserti128 ymm5, ymm1, xmm6, 1 | |
vmovdqa ymmword ptr [rsp + 928], ymm5 | |
vinserti128 ymm5, ymm4, xmm8, 1 | |
vmovdqa ymmword ptr [rsp + 960], ymm5 | |
vinserti128 ymm5, ymm0, xmm3, 1 | |
vmovdqa ymmword ptr [rsp + 992], ymm5 | |
vperm2i128 ymm2, ymm7, ymm2, 49 ## ymm2 = ymm7[2,3],ymm2[2,3] | |
vmovdqa ymmword ptr [rsp + 1024], ymm2 | |
vperm2i128 ymm1, ymm1, ymm6, 49 ## ymm1 = ymm1[2,3],ymm6[2,3] | |
vmovdqa ymmword ptr [rsp + 1056], ymm1 | |
vperm2i128 ymm11, ymm4, ymm8, 49 ## ymm11 = ymm4[2,3],ymm8[2,3] | |
vmovdqa ymmword ptr [rsp + 1088], ymm11 | |
vmovdqa ymmword ptr [rsp + 384], ymm11 ## 32-byte Spill | |
vperm2i128 ymm0, ymm0, ymm3, 49 ## ymm0 = ymm0[2,3],ymm3[2,3] | |
vmovdqa ymmword ptr [rsp], ymm0 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1120], ymm0 | |
vmovdqa ymm0, ymmword ptr [rsp + 1152] | |
vmovdqa ymm1, ymmword ptr [rsp + 1184] | |
vpunpckldq ymm2, ymm0, ymm1 ## ymm2 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] | |
vpunpckhdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] | |
vmovdqa ymm1, ymmword ptr [rsp + 1216] | |
vmovdqa ymm3, ymmword ptr [rsp + 1248] | |
vpunpckldq ymm4, ymm1, ymm3 ## ymm4 = ymm1[0],ymm3[0],ymm1[1],ymm3[1],ymm1[4],ymm3[4],ymm1[5],ymm3[5] | |
vpunpckhdq ymm1, ymm1, ymm3 ## ymm1 = ymm1[2],ymm3[2],ymm1[3],ymm3[3],ymm1[6],ymm3[6],ymm1[7],ymm3[7] | |
vmovdqa ymm3, ymmword ptr [rsp + 1280] | |
vmovdqa ymm5, ymmword ptr [rsp + 1312] | |
vpunpckldq ymm6, ymm3, ymm5 ## ymm6 = ymm3[0],ymm5[0],ymm3[1],ymm5[1],ymm3[4],ymm5[4],ymm3[5],ymm5[5] | |
vpunpckhdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[2],ymm5[2],ymm3[3],ymm5[3],ymm3[6],ymm5[6],ymm3[7],ymm5[7] | |
vmovdqa ymm5, ymmword ptr [rsp + 1344] | |
vmovdqa ymm7, ymmword ptr [rsp + 1376] | |
vpunpckldq ymm8, ymm5, ymm7 ## ymm8 = ymm5[0],ymm7[0],ymm5[1],ymm7[1],ymm5[4],ymm7[4],ymm5[5],ymm7[5] | |
vpunpckhdq ymm5, ymm5, ymm7 ## ymm5 = ymm5[2],ymm7[2],ymm5[3],ymm7[3],ymm5[6],ymm7[6],ymm5[7],ymm7[7] | |
vpunpcklqdq ymm7, ymm2, ymm4 ## ymm7 = ymm2[0],ymm4[0],ymm2[2],ymm4[2] | |
vpunpckhqdq ymm2, ymm2, ymm4 ## ymm2 = ymm2[1],ymm4[1],ymm2[3],ymm4[3] | |
vpunpcklqdq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] | |
vpunpckhqdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] | |
vpunpcklqdq ymm1, ymm6, ymm8 ## ymm1 = ymm6[0],ymm8[0],ymm6[2],ymm8[2] | |
vpunpckhqdq ymm6, ymm6, ymm8 ## ymm6 = ymm6[1],ymm8[1],ymm6[3],ymm8[3] | |
vpunpcklqdq ymm8, ymm3, ymm5 ## ymm8 = ymm3[0],ymm5[0],ymm3[2],ymm5[2] | |
vpunpckhqdq ymm3, ymm3, ymm5 ## ymm3 = ymm3[1],ymm5[1],ymm3[3],ymm5[3] | |
vinserti128 ymm5, ymm7, xmm1, 1 | |
vmovdqa ymmword ptr [rsp + 352], ymm5 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1152], ymm5 | |
vinserti128 ymm5, ymm2, xmm6, 1 | |
vmovdqa ymmword ptr [rsp + 224], ymm5 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1184], ymm5 | |
vinserti128 ymm5, ymm4, xmm8, 1 | |
vmovdqa ymmword ptr [rsp + 128], ymm5 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1216], ymm5 | |
vinserti128 ymm5, ymm0, xmm3, 1 | |
vmovdqa ymmword ptr [rsp + 160], ymm5 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1248], ymm5 | |
vperm2i128 ymm1, ymm7, ymm1, 49 ## ymm1 = ymm7[2,3],ymm1[2,3] | |
vmovdqa ymmword ptr [rsp + 32], ymm1 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1280], ymm1 | |
vperm2i128 ymm1, ymm2, ymm6, 49 ## ymm1 = ymm2[2,3],ymm6[2,3] | |
vmovdqa ymmword ptr [rsp + 480], ymm1 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1312], ymm1 | |
vperm2i128 ymm1, ymm4, ymm8, 49 ## ymm1 = ymm4[2,3],ymm8[2,3] | |
vmovdqa ymmword ptr [rsp + 320], ymm1 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1344], ymm1 | |
vperm2i128 ymm0, ymm0, ymm3, 49 ## ymm0 = ymm0[2,3],ymm3[2,3] | |
vmovdqa ymmword ptr [rsp + 256], ymm0 ## 32-byte Spill | |
vmovdqa ymmword ptr [rsp + 1376], ymm0 | |
vmovdqa xmm0, xmmword ptr [rdi + 128] | |
vinserti128 ymm4, ymm0, xmmword ptr [rdi + 144], 1 | |
vmovdqa xmm0, xmmword ptr [rdi + 160] | |
vinserti128 ymm3, ymm0, xmmword ptr [rdi + 176], 1 | |
vpsrld ymm0, ymm4, 6 | |
vpslld ymm1, ymm4, 26 | |
vpor ymm0, ymm1, ymm0 | |
vpsrld ymm1, ymm4, 11 | |
vpslld ymm2, ymm4, 21 | |
vpor ymm1, ymm2, ymm1 | |
vpxor ymm0, ymm1, ymm0 | |
vpsrld ymm1, ymm4, 25 | |
vpslld ymm2, ymm4, 7 | |
vpor ymm1, ymm2, ymm1 | |
vmovdqa xmm2, xmmword ptr [rdi + 192] | |
vinserti128 ymm5, ymm2, xmmword ptr [rdi + 208], 1 | |
vpxor ymm0, ymm0, ymm1 | |
vpand ymm1, ymm3, ymm4 | |
vmovdqa ymm7, ymm3 | |
vpandn ymm2, ymm4, ymm5 | |
vmovdqa ymm6, ymm5 | |
vmovdqa ymmword ptr [rsp + 800], ymm6 ## 32-byte Spill | |
vpxor ymm1, ymm2, ymm1 | |
vmovdqa xmm2, xmmword ptr [rdi + 224] | |
vinserti128 ymm2, ymm2, xmmword ptr [rdi + 240], 1 | |
vmovdqa ymmword ptr [rsp + 864], ymm2 ## 32-byte Spill | |
vpaddd ymm2, ymm9, ymm2 | |
vpaddd ymm1, ymm2, ymm1 | |
vpbroadcastd ymm2, dword ptr [rip + LCPI2_1] ## ymm2 = [1116352408,1116352408,1116352408,1116352408,1116352408,1116352408,1116352408,1116352408] | |
vpaddd ymm1, ymm1, ymm2 | |
vpaddd ymm1, ymm0, ymm1 | |
vmovdqa xmm0, xmmword ptr [rdi] | |
vinserti128 ymm5, ymm0, xmmword ptr [rdi + 16], 1 | |
vpsrld ymm0, ymm5, 2 | |
vpslld ymm2, ymm5, 30 | |
vpor ymm0, ymm2, ymm0 | |
vpsrld ymm2, ymm5, 13 | |
vpslld ymm3, ymm5, 19 | |
vpor ymm2, ymm3, ymm2 | |
vpxor ymm0, ymm2, ymm0 | |
vpsrld ymm2, ymm5, 22 | |
vpslld ymm3, ymm5, 10 | |
vpor ymm2, ymm3, ymm2 | |
vpxor ymm0, ymm0, ymm2 | |
vmovdqa xmm2, xmmword ptr [rdi + 32] | |
vinserti128 ymm9, ymm2, xmmword ptr [rdi + 48], 1 | |
vmovdqa xmm2, xmmword ptr [rdi + 64] | |
vinserti128 ymm8, ymm2, xmmword ptr [rdi + 80], 1 | |
vpxor ymm2, ymm8, ymm9 | |
vpand ymm2, ymm2, ymm5 | |
vmovdqa ymm13, ymm5 | |
vpand ymm3, ymm8, ymm9 | |
vmovdqa ymm10, ymm9 | |
vmovdqa ymmword ptr [rsp + 768], ymm8 ## 32-byte Spill | |
vpxor ymm2, ymm2, ymm3 | |
vpaddd ymm0, ymm0, ymm2 | |
vmovdqa xmm2, xmmword ptr [rdi + 96] | |
vinserti128 ymm2, ymm2, xmmword ptr [rdi + 112], 1 | |
vmovdqa ymmword ptr [rsp + 832], ymm2 ## 32-byte Spill | |
vpaddd ymm0, ymm0, ymm1 | |
vpaddd ymm5, ymm1, ymm2 | |
vpsrld ymm1, ymm5, 6 | |
vpslld ymm2, ymm5, 26 | |
vpor ymm1, ymm2, ymm1 | |
vpsrld ymm2, ymm5, 11 | |
vpslld ymm3, ymm5, 21 | |
vpor ymm2, ymm3, ymm2 | |
vpxor ymm1, ymm2, ymm1 | |
vpsrld ymm2, ymm5, 25 | |
vpslld ymm3, ymm5, 7 | |
vpor ymm2, ymm3, ymm2 | |
vpxor ymm1, ymm1, ymm2 | |
vpand ymm2, ymm4, ymm5 | |
vmovdqa ymm12, ymm4 | |
vpandn ymm3, ymm5, ymm7 | |
vmovdqa ymm9, ymm7 | |
vmovdqa ymmword ptr [rsp + 736], ymm9 ## 32-byte Spill | |
vpxor ymm2, ymm3, ymm2 | |
vmovdqa ymm3, ymmword ptr [rsp + 928] | |
vmovdqa ymmword ptr [rsp + 288], ymm3 ## 32-byte Spill | |
vpaddd ymm3, ymm6, ymm3 | |
vpaddd ymm2, ymm3, ymm2 | |
vpbroadcastd ymm3, dword ptr [rip + LCPI2_2] ## ymm3 = [1899447441,1899447441,1899447441,1899447441,1899447441,1899447441,1899447441,1899447441] | |
vpaddd ymm2, ymm2, ymm3 | |
vpaddd ymm2, ymm1, ymm2 | |
vpsrld ymm1, ymm0, 2 | |
vpslld ymm3, ymm0, 30 | |
vpor ymm1, ymm3, ymm1 | |
vpsrld ymm3, ymm0, 13 | |
vpslld ymm4, ymm0, 19 | |
vpor ymm3, ymm4, ymm3 | |
vpxor ymm1, ymm3, ymm1 | |
vpsrld ymm3, ymm0, 22 | |
vpslld ymm4, ymm0, 10 | |
vpor ymm3, ymm4, ymm3 | |
vpxor ymm1, ymm1, ymm3 | |
vpand ymm3, ymm10, ymm13 | |
vpand ymm4, ymm13, ymm0 | |
vmovdqa ymm14, ymm13 | |
vpxor ymm3, ymm4, ymm3 | |
vpand ymm4, ymm10, ymm0 | |
vmovdqa ymm13, ymm10 | |
vmovdqa ymmword ptr [rsp + 704], ymm13 ## 32-byte Spill | |
vpxor ymm3, ymm3, ymm4 | |
vpaddd ymm1, ymm1, ymm3 | |
vpaddd ymm1, ymm1, ymm2 | |
vpaddd ymm7, ymm2, ymm8 | |
vpsrld ymm2, ymm7, 6 | |
vpslld ymm3, ymm7, 26 | |
vpor ymm2, ymm3, ymm2 | |
vpsrld ymm3, ymm7, 11 | |
vpslld ymm4, ymm7, 21 | |
vpor ymm3, ymm4, ymm3 | |
vpxor ymm2, ymm3, ymm2 | |
vpsrld ymm3, ymm7, 25 | |
vpslld ymm4, ymm7, 7 | |
vpor ymm3, ymm4, ymm3 | |
vpxor ymm2, ymm2, ymm3 | |
vpand ymm3, ymm7, ymm5 | |
vmovdqa ymm10, ymm12 | |
vmovdqa ymmword ptr [rsp + 672], ymm10 ## 32-byte Spill | |
vpandn ymm4, ymm7, ymm10 | |
vpxor ymm3, ymm3, ymm4 | |
vmovdqa ymm4, ymmword ptr [rsp + 960] | |
vmovdqa ymmword ptr [rsp + 96], ymm4 ## 32-byte Spill | |
vpaddd ymm4, ymm9, ymm4 | |
vpaddd ymm3, ymm4, ymm3 | |
vpbroadcastd ymm4, dword ptr [rip + LCPI2_3] ## ymm4 = [3049323471,3049323471,3049323471,3049323471,3049323471,3049323471,3049323471,3049323471] | |
vpaddd ymm3, ymm3, ymm4 | |
vpaddd ymm3, ymm2, ymm3 | |
vpsrld ymm2, ymm1, 2 | |
vpslld ymm4, ymm1, 30 | |
vpor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm1, 13 | |
vpslld ymm6, ymm1, 19 | |
vpor ymm4, ymm6, ymm4 | |
vpxor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm1, 22 | |
vpslld ymm6, ymm1, 10 | |
vpor ymm4, ymm6, ymm4 | |
vpxor ymm2, ymm2, ymm4 | |
vpxor ymm4, ymm14, ymm1 | |
vpand ymm4, ymm4, ymm0 | |
vpand ymm6, ymm14, ymm1 | |
vmovdqa ymmword ptr [rsp + 640], ymm14 ## 32-byte Spill | |
vpxor ymm4, ymm4, ymm6 | |
vpaddd ymm2, ymm2, ymm4 | |
vpaddd ymm2, ymm2, ymm3 | |
vpaddd ymm8, ymm3, ymm13 | |
vpsrld ymm3, ymm8, 6 | |
vpslld ymm4, ymm8, 26 | |
vpor ymm3, ymm4, ymm3 | |
vpsrld ymm4, ymm8, 11 | |
vpslld ymm6, ymm8, 21 | |
vpor ymm4, ymm6, ymm4 | |
vpxor ymm3, ymm4, ymm3 | |
vpsrld ymm4, ymm8, 25 | |
vpslld ymm6, ymm8, 7 | |
vpor ymm4, ymm6, ymm4 | |
vpxor ymm3, ymm3, ymm4 | |
vpand ymm4, ymm8, ymm7 | |
vpandn ymm6, ymm8, ymm5 | |
vpxor ymm4, ymm4, ymm6 | |
vmovdqa ymm6, ymmword ptr [rsp + 992] | |
vmovdqa ymmword ptr [rsp + 448], ymm6 ## 32-byte Spill | |
vpaddd ymm6, ymm10, ymm6 | |
vpaddd ymm4, ymm6, ymm4 | |
vpbroadcastd ymm6, dword ptr [rip + LCPI2_4] ## ymm6 = [3921009573,3921009573,3921009573,3921009573,3921009573,3921009573,3921009573,3921009573] | |
vpaddd ymm4, ymm4, ymm6 | |
vpaddd ymm3, ymm3, ymm4 | |
vpsrld ymm4, ymm2, 2 | |
vpslld ymm6, ymm2, 30 | |
vpor ymm4, ymm6, ymm4 | |
vpsrld ymm6, ymm2, 13 | |
vpslld ymm9, ymm2, 19 | |
vpor ymm6, ymm9, ymm6 | |
vpxor ymm4, ymm6, ymm4 | |
vpsrld ymm6, ymm2, 22 | |
vpslld ymm9, ymm2, 10 | |
vpor ymm6, ymm9, ymm6 | |
vpxor ymm4, ymm4, ymm6 | |
vpand ymm9, ymm1, ymm0 | |
vpand ymm6, ymm2, ymm1 | |
vpxor ymm9, ymm6, ymm9 | |
vpand ymm10, ymm2, ymm0 | |
vpxor ymm9, ymm9, ymm10 | |
vpaddd ymm4, ymm4, ymm9 | |
vpaddd ymm4, ymm4, ymm3 | |
vpaddd ymm10, ymm3, ymm14 | |
vpsrld ymm3, ymm10, 6 | |
vpslld ymm9, ymm10, 26 | |
vpor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm10, 11 | |
vpslld ymm14, ymm10, 21 | |
vpor ymm9, ymm14, ymm9 | |
vpxor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm10, 25 | |
vpslld ymm14, ymm10, 7 | |
vpor ymm9, ymm14, ymm9 | |
vpxor ymm3, ymm3, ymm9 | |
vpand ymm9, ymm10, ymm8 | |
vpandn ymm14, ymm10, ymm7 | |
vpxor ymm9, ymm9, ymm14 | |
vmovdqa ymm12, ymmword ptr [rsp + 1024] | |
vmovdqa ymmword ptr [rsp + 64], ymm12 ## 32-byte Spill | |
vpaddd ymm5, ymm12, ymm5 | |
vpaddd ymm5, ymm5, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_5] ## ymm9 = [961987163,961987163,961987163,961987163,961987163,961987163,961987163,961987163] | |
vpaddd ymm5, ymm5, ymm9 | |
vpaddd ymm9, ymm3, ymm5 | |
vpsrld ymm3, ymm4, 2 | |
vpslld ymm5, ymm4, 30 | |
vpor ymm3, ymm5, ymm3 | |
vpsrld ymm5, ymm4, 13 | |
vpslld ymm15, ymm4, 19 | |
vpor ymm5, ymm15, ymm5 | |
vpxor ymm3, ymm5, ymm3 | |
vpsrld ymm5, ymm4, 22 | |
vpslld ymm15, ymm4, 10 | |
vpor ymm5, ymm15, ymm5 | |
vpxor ymm5, ymm3, ymm5 | |
vpand ymm3, ymm4, ymm2 | |
vpxor ymm6, ymm3, ymm6 | |
vpand ymm15, ymm4, ymm1 | |
vpxor ymm6, ymm6, ymm15 | |
vpaddd ymm6, ymm5, ymm6 | |
vpaddd ymm5, ymm9, ymm0 | |
vpaddd ymm0, ymm6, ymm9 | |
vpsrld ymm6, ymm5, 6 | |
vpslld ymm9, ymm5, 26 | |
vpor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm5, 11 | |
vpslld ymm15, ymm5, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm5, 25 | |
vpslld ymm15, ymm5, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm6, ymm9 | |
vpand ymm9, ymm5, ymm10 | |
vpandn ymm15, ymm5, ymm8 | |
vpxor ymm9, ymm9, ymm15 | |
vmovdqa ymm12, ymmword ptr [rsp + 1056] | |
vmovdqa ymmword ptr [rsp + 416], ymm12 ## 32-byte Spill | |
vpaddd ymm7, ymm12, ymm7 | |
vpaddd ymm7, ymm7, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_6] ## ymm9 = [1508970993,1508970993,1508970993,1508970993,1508970993,1508970993,1508970993,1508970993] | |
vpaddd ymm7, ymm7, ymm9 | |
vpaddd ymm9, ymm6, ymm7 | |
vpsrld ymm6, ymm0, 2 | |
vpslld ymm7, ymm0, 30 | |
vpor ymm6, ymm7, ymm6 | |
vpsrld ymm7, ymm0, 13 | |
vpslld ymm15, ymm0, 19 | |
vpor ymm7, ymm15, ymm7 | |
vpxor ymm6, ymm7, ymm6 | |
vpsrld ymm7, ymm0, 22 | |
vpslld ymm15, ymm0, 10 | |
vpor ymm7, ymm15, ymm7 | |
vpxor ymm7, ymm6, ymm7 | |
vpand ymm6, ymm0, ymm4 | |
vpxor ymm3, ymm6, ymm3 | |
vpand ymm15, ymm0, ymm2 | |
vpxor ymm3, ymm3, ymm15 | |
vpaddd ymm3, ymm7, ymm3 | |
vpaddd ymm7, ymm9, ymm1 | |
vpaddd ymm1, ymm3, ymm9 | |
vpsrld ymm3, ymm7, 6 | |
vpslld ymm9, ymm7, 26 | |
vpor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm7, 11 | |
vpslld ymm15, ymm7, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm7, 25 | |
vpslld ymm15, ymm7, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm3, ymm3, ymm9 | |
vpand ymm9, ymm7, ymm5 | |
vpandn ymm15, ymm7, ymm10 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm8, ymm11, ymm8 | |
vpaddd ymm8, ymm8, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_7] ## ymm9 = [2453635748,2453635748,2453635748,2453635748,2453635748,2453635748,2453635748,2453635748] | |
vpaddd ymm8, ymm8, ymm9 | |
vpaddd ymm9, ymm3, ymm8 | |
vpsrld ymm3, ymm1, 2 | |
vpslld ymm8, ymm1, 30 | |
vpor ymm3, ymm8, ymm3 | |
vpsrld ymm8, ymm1, 13 | |
vpslld ymm15, ymm1, 19 | |
vpor ymm8, ymm15, ymm8 | |
vpxor ymm3, ymm8, ymm3 | |
vpsrld ymm8, ymm1, 22 | |
vpslld ymm15, ymm1, 10 | |
vpor ymm8, ymm15, ymm8 | |
vpxor ymm8, ymm3, ymm8 | |
vpand ymm3, ymm1, ymm0 | |
vpxor ymm6, ymm3, ymm6 | |
vpand ymm15, ymm1, ymm4 | |
vpxor ymm6, ymm6, ymm15 | |
vpaddd ymm6, ymm8, ymm6 | |
vpaddd ymm8, ymm9, ymm2 | |
vpaddd ymm2, ymm6, ymm9 | |
vpsrld ymm6, ymm8, 6 | |
vpslld ymm9, ymm8, 26 | |
vpor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm8, 11 | |
vpslld ymm15, ymm8, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm8, 25 | |
vpslld ymm15, ymm8, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm6, ymm9 | |
vpand ymm9, ymm8, ymm7 | |
vpandn ymm15, ymm8, ymm5 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm10, ymm9 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_8] ## ymm10 = [2870763221,2870763221,2870763221,2870763221,2870763221,2870763221,2870763221,2870763221] | |
vpaddd ymm9, ymm9, ymm10 | |
vpaddd ymm9, ymm6, ymm9 | |
vpsrld ymm6, ymm2, 2 | |
vpslld ymm10, ymm2, 30 | |
vpor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm2, 13 | |
vpslld ymm15, ymm2, 19 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm2, 22 | |
vpslld ymm15, ymm2, 10 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm10, ymm6, ymm10 | |
vpand ymm6, ymm2, ymm1 | |
vpxor ymm3, ymm6, ymm3 | |
vpand ymm15, ymm2, ymm0 | |
vpxor ymm3, ymm3, ymm15 | |
vpaddd ymm3, ymm10, ymm3 | |
vpaddd ymm10, ymm9, ymm4 | |
vpaddd ymm4, ymm3, ymm9 | |
vpsrld ymm3, ymm10, 6 | |
vpslld ymm9, ymm10, 26 | |
vpor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm10, 11 | |
vpslld ymm15, ymm10, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm10, 25 | |
vpslld ymm15, ymm10, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm3, ymm3, ymm9 | |
vpand ymm9, ymm10, ymm8 | |
vpandn ymm15, ymm10, ymm7 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm5, ymm5, ymmword ptr [rsp + 352] ## 32-byte Folded Reload | |
vpaddd ymm5, ymm5, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_9] ## ymm9 = [3624381080,3624381080,3624381080,3624381080,3624381080,3624381080,3624381080,3624381080] | |
vpaddd ymm5, ymm5, ymm9 | |
vpaddd ymm3, ymm3, ymm5 | |
vpsrld ymm5, ymm4, 2 | |
vpslld ymm9, ymm4, 30 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm4, 13 | |
vpslld ymm15, ymm4, 19 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm4, 22 | |
vpslld ymm15, ymm4, 10 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm9, ymm5, ymm9 | |
vpand ymm5, ymm4, ymm2 | |
vpxor ymm6, ymm5, ymm6 | |
vpand ymm15, ymm4, ymm1 | |
vpxor ymm6, ymm6, ymm15 | |
vpaddd ymm6, ymm9, ymm6 | |
vpaddd ymm0, ymm3, ymm0 | |
vpaddd ymm3, ymm6, ymm3 | |
vpsrld ymm6, ymm0, 6 | |
vpslld ymm9, ymm0, 26 | |
vpor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm0, 11 | |
vpslld ymm15, ymm0, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm0, 25 | |
vpslld ymm15, ymm0, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm6, ymm9 | |
vpand ymm9, ymm0, ymm10 | |
vpandn ymm15, ymm0, ymm8 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 224] ## 32-byte Folded Reload | |
vpaddd ymm7, ymm7, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_10] ## ymm9 = [310598401,310598401,310598401,310598401,310598401,310598401,310598401,310598401] | |
vpaddd ymm7, ymm7, ymm9 | |
vpaddd ymm6, ymm6, ymm7 | |
vpsrld ymm7, ymm3, 2 | |
vpslld ymm9, ymm3, 30 | |
vpor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm3, 13 | |
vpslld ymm15, ymm3, 19 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm3, 22 | |
vpslld ymm15, ymm3, 10 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm9, ymm7, ymm9 | |
vpand ymm7, ymm3, ymm4 | |
vpxor ymm5, ymm7, ymm5 | |
vpand ymm15, ymm3, ymm2 | |
vpxor ymm5, ymm5, ymm15 | |
vpaddd ymm5, ymm9, ymm5 | |
vpaddd ymm1, ymm6, ymm1 | |
vpaddd ymm6, ymm5, ymm6 | |
vpsrld ymm5, ymm1, 6 | |
vpslld ymm9, ymm1, 26 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm1, 11 | |
vpslld ymm15, ymm1, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm1, 25 | |
vpslld ymm15, ymm1, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm5, ymm9 | |
vpand ymm9, ymm1, ymm0 | |
vpandn ymm15, ymm1, ymm10 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm8, ymm8, ymmword ptr [rsp + 128] ## 32-byte Folded Reload | |
vpaddd ymm8, ymm8, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_11] ## ymm9 = [607225278,607225278,607225278,607225278,607225278,607225278,607225278,607225278] | |
vpaddd ymm8, ymm8, ymm9 | |
vpaddd ymm5, ymm5, ymm8 | |
vpsrld ymm8, ymm6, 2 | |
vpslld ymm9, ymm6, 30 | |
vpor ymm8, ymm9, ymm8 | |
vpsrld ymm9, ymm6, 13 | |
vpslld ymm15, ymm6, 19 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm8, ymm9, ymm8 | |
vpsrld ymm9, ymm6, 22 | |
vpslld ymm15, ymm6, 10 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm9, ymm8, ymm9 | |
vpand ymm8, ymm6, ymm3 | |
vpxor ymm7, ymm8, ymm7 | |
vpand ymm15, ymm6, ymm4 | |
vpxor ymm7, ymm7, ymm15 | |
vpaddd ymm7, ymm9, ymm7 | |
vpaddd ymm2, ymm5, ymm2 | |
vpaddd ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm2, 6 | |
vpslld ymm9, ymm2, 26 | |
vpor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm2, 11 | |
vpslld ymm15, ymm2, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm2, 25 | |
vpslld ymm15, ymm2, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm7, ymm7, ymm9 | |
vpand ymm9, ymm2, ymm1 | |
vpandn ymm15, ymm2, ymm0 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm10, ymm9 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_12] ## ymm10 = [1426881987,1426881987,1426881987,1426881987,1426881987,1426881987,1426881987,1426881987] | |
vpaddd ymm9, ymm9, ymm10 | |
vpaddd ymm7, ymm7, ymm9 | |
vpsrld ymm9, ymm5, 2 | |
vpslld ymm10, ymm5, 30 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm5, 13 | |
vpslld ymm15, ymm5, 19 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm5, 22 | |
vpslld ymm15, ymm5, 10 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm5, ymm6 | |
vpxor ymm8, ymm10, ymm8 | |
vpand ymm15, ymm5, ymm3 | |
vpxor ymm8, ymm8, ymm15 | |
vpaddd ymm8, ymm9, ymm8 | |
vpaddd ymm4, ymm7, ymm4 | |
vpaddd ymm7, ymm8, ymm7 | |
vpsrld ymm8, ymm4, 6 | |
vpslld ymm9, ymm4, 26 | |
vpor ymm8, ymm9, ymm8 | |
vpsrld ymm9, ymm4, 11 | |
vpslld ymm15, ymm4, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm8, ymm9, ymm8 | |
vpsrld ymm9, ymm4, 25 | |
vpslld ymm15, ymm4, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm8, ymm8, ymm9 | |
vpand ymm9, ymm4, ymm2 | |
vpandn ymm15, ymm4, ymm1 | |
vpxor ymm9, ymm9, ymm15 | |
vpaddd ymm0, ymm0, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm0, ymm0, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_13] ## ymm9 = [1925078388,1925078388,1925078388,1925078388,1925078388,1925078388,1925078388,1925078388] | |
vpaddd ymm0, ymm0, ymm9 | |
vpaddd ymm9, ymm8, ymm0 | |
vpsrld ymm0, ymm7, 2 | |
vpslld ymm8, ymm7, 30 | |
vpor ymm0, ymm8, ymm0 | |
vpsrld ymm8, ymm7, 13 | |
vpslld ymm15, ymm7, 19 | |
vpor ymm8, ymm15, ymm8 | |
vpxor ymm0, ymm8, ymm0 | |
vpsrld ymm8, ymm7, 22 | |
vpslld ymm15, ymm7, 10 | |
vpor ymm8, ymm15, ymm8 | |
vpxor ymm8, ymm0, ymm8 | |
vpand ymm0, ymm7, ymm5 | |
vpxor ymm10, ymm0, ymm10 | |
vpand ymm15, ymm7, ymm6 | |
vpxor ymm10, ymm10, ymm15 | |
vpaddd ymm10, ymm8, ymm10 | |
vpaddd ymm8, ymm9, ymm3 | |
vpaddd ymm3, ymm10, ymm9 | |
vpsrld ymm9, ymm8, 6 | |
vpslld ymm10, ymm8, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm8, 11 | |
vpslld ymm15, ymm8, 21 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm8, 25 | |
vpslld ymm15, ymm8, 7 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm8, ymm4 | |
vpandn ymm15, ymm8, ymm2 | |
vpxor ymm10, ymm10, ymm15 | |
vpaddd ymm1, ymm1, ymmword ptr [rsp + 480] ## 32-byte Folded Reload | |
vpaddd ymm1, ymm1, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_14] ## ymm10 = [2162078206,2162078206,2162078206,2162078206,2162078206,2162078206,2162078206,2162078206] | |
vpaddd ymm1, ymm1, ymm10 | |
vpaddd ymm9, ymm9, ymm1 | |
vpsrld ymm1, ymm3, 2 | |
vpslld ymm10, ymm3, 30 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm3, 13 | |
vpslld ymm15, ymm3, 19 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm3, 22 | |
vpslld ymm15, ymm3, 10 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm10, ymm1, ymm10 | |
vpand ymm1, ymm3, ymm7 | |
vpxor ymm0, ymm1, ymm0 | |
vpand ymm15, ymm3, ymm5 | |
vpxor ymm0, ymm0, ymm15 | |
vpaddd ymm10, ymm10, ymm0 | |
vpaddd ymm0, ymm9, ymm6 | |
vpaddd ymm10, ymm10, ymm9 | |
vpsrld ymm6, ymm0, 6 | |
vpslld ymm9, ymm0, 26 | |
vpor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm0, 11 | |
vpslld ymm15, ymm0, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm0, 25 | |
vpslld ymm15, ymm0, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm6, ymm6, ymm9 | |
vpand ymm9, ymm0, ymm8 | |
vpandn ymm15, ymm0, ymm4 | |
vpxor ymm9, ymm9, ymm15 | |
vmovdqa ymm12, ymmword ptr [rsp + 320] ## 32-byte Reload | |
vpaddd ymm2, ymm12, ymm2 | |
vpaddd ymm2, ymm2, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_15] ## ymm9 = [2614888103,2614888103,2614888103,2614888103,2614888103,2614888103,2614888103,2614888103] | |
vpaddd ymm2, ymm2, ymm9 | |
vpaddd ymm6, ymm6, ymm2 | |
vpsrld ymm2, ymm10, 2 | |
vpslld ymm9, ymm10, 30 | |
vpor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm10, 13 | |
vpslld ymm15, ymm10, 19 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm10, 22 | |
vpslld ymm15, ymm10, 10 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm9, ymm2, ymm9 | |
vpand ymm2, ymm10, ymm3 | |
vpxor ymm1, ymm2, ymm1 | |
vpand ymm15, ymm10, ymm7 | |
vpxor ymm1, ymm1, ymm15 | |
vpaddd ymm9, ymm9, ymm1 | |
vpaddd ymm1, ymm6, ymm5 | |
vpaddd ymm6, ymm9, ymm6 | |
vpsrld ymm5, ymm1, 6 | |
vpslld ymm9, ymm1, 26 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm1, 11 | |
vpslld ymm15, ymm1, 21 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm1, 25 | |
vpslld ymm15, ymm1, 7 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm5, ymm9 | |
vpand ymm9, ymm1, ymm0 | |
vpandn ymm15, ymm1, ymm8 | |
vpxor ymm9, ymm9, ymm15 | |
vmovdqa ymm11, ymmword ptr [rsp + 256] ## 32-byte Reload | |
vpaddd ymm4, ymm11, ymm4 | |
vpaddd ymm4, ymm4, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_16] ## ymm9 = [3248222580,3248222580,3248222580,3248222580,3248222580,3248222580,3248222580,3248222580] | |
vpaddd ymm4, ymm4, ymm9 | |
vpaddd ymm4, ymm5, ymm4 | |
vpsrld ymm5, ymm6, 2 | |
vpslld ymm9, ymm6, 30 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm6, 13 | |
vpslld ymm15, ymm6, 19 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm6, 22 | |
vpslld ymm15, ymm6, 10 | |
vpor ymm9, ymm15, ymm9 | |
vpxor ymm5, ymm5, ymm9 | |
vpand ymm9, ymm6, ymm10 | |
vpxor ymm2, ymm9, ymm2 | |
vpand ymm15, ymm6, ymm3 | |
vpxor ymm2, ymm2, ymm15 | |
vpaddd ymm2, ymm5, ymm2 | |
vpaddd ymm5, ymm4, ymm7 | |
vpaddd ymm7, ymm2, ymm4 | |
vpsrld ymm2, ymm12, 17 | |
vpslld ymm4, ymm12, 15 | |
vpor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm12, 19 | |
vpslld ymm15, ymm12, 13 | |
vpor ymm4, ymm15, ymm4 | |
vpsrld ymm15, ymm12, 10 | |
vpxor ymm2, ymm2, ymm15 | |
vpxor ymm2, ymm2, ymm4 | |
vmovdqa ymm13, ymmword ptr [rsp + 288] ## 32-byte Reload | |
vpsrld ymm4, ymm13, 7 | |
vpslld ymm15, ymm13, 25 | |
vpor ymm4, ymm15, ymm4 | |
vpsrld ymm15, ymm13, 18 | |
vpslld ymm14, ymm13, 14 | |
vpor ymm14, ymm14, ymm15 | |
vpsrld ymm15, ymm13, 3 | |
vpxor ymm4, ymm4, ymm15 | |
vpxor ymm4, ymm4, ymm14 | |
vmovdqa ymm12, ymmword ptr [rsp + 224] ## 32-byte Reload | |
vpaddd ymm14, ymm12, ymmword ptr [rsp + 192] ## 32-byte Folded Reload | |
vpaddd ymm4, ymm4, ymm14 | |
vpaddd ymm12, ymm4, ymm2 | |
vpsrld ymm2, ymm5, 6 | |
vpslld ymm4, ymm5, 26 | |
vpor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm5, 11 | |
vpslld ymm14, ymm5, 21 | |
vpor ymm4, ymm14, ymm4 | |
vpxor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm5, 25 | |
vpslld ymm14, ymm5, 7 | |
vpor ymm4, ymm14, ymm4 | |
vpxor ymm2, ymm2, ymm4 | |
vpand ymm4, ymm5, ymm1 | |
vpandn ymm14, ymm5, ymm0 | |
vpxor ymm4, ymm4, ymm14 | |
vpaddd ymm8, ymm12, ymm8 | |
vpaddd ymm4, ymm8, ymm4 | |
vpbroadcastd ymm8, dword ptr [rip + LCPI2_17] ## ymm8 = [3835390401,3835390401,3835390401,3835390401,3835390401,3835390401,3835390401,3835390401] | |
vpaddd ymm4, ymm4, ymm8 | |
vpaddd ymm8, ymm2, ymm4 | |
vpsrld ymm2, ymm7, 2 | |
vpslld ymm4, ymm7, 30 | |
vpor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm7, 13 | |
vpslld ymm14, ymm7, 19 | |
vpor ymm4, ymm14, ymm4 | |
vpxor ymm2, ymm4, ymm2 | |
vpsrld ymm4, ymm7, 22 | |
vpslld ymm14, ymm7, 10 | |
vpor ymm4, ymm14, ymm4 | |
vpxor ymm2, ymm2, ymm4 | |
vpand ymm4, ymm7, ymm6 | |
vpxor ymm9, ymm4, ymm9 | |
vpand ymm14, ymm7, ymm10 | |
vpxor ymm9, ymm9, ymm14 | |
vpaddd ymm9, ymm2, ymm9 | |
vpaddd ymm2, ymm8, ymm3 | |
vpaddd ymm8, ymm9, ymm8 | |
vpsrld ymm3, ymm11, 17 | |
vpslld ymm9, ymm11, 15 | |
vpor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm11, 19 | |
vpslld ymm14, ymm11, 13 | |
vpor ymm9, ymm14, ymm9 | |
vpsrld ymm14, ymm11, 10 | |
vpxor ymm3, ymm3, ymm14 | |
vpxor ymm3, ymm3, ymm9 | |
vmovdqa ymm11, ymmword ptr [rsp + 96] ## 32-byte Reload | |
vpsrld ymm9, ymm11, 7 | |
vpslld ymm14, ymm11, 25 | |
vpor ymm9, ymm14, ymm9 | |
vpsrld ymm14, ymm11, 18 | |
vpslld ymm15, ymm11, 14 | |
vpor ymm14, ymm15, ymm14 | |
vpsrld ymm15, ymm11, 3 | |
vpxor ymm9, ymm9, ymm15 | |
vpxor ymm9, ymm9, ymm14 | |
vpaddd ymm11, ymm13, ymmword ptr [rsp + 128] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymm11 | |
vpaddd ymm15, ymm9, ymm3 | |
vpsrld ymm3, ymm2, 6 | |
vpslld ymm9, ymm2, 26 | |
vpor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm2, 11 | |
vpslld ymm11, ymm2, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm2, 25 | |
vpslld ymm11, ymm2, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm3, ymm3, ymm9 | |
vpand ymm9, ymm2, ymm5 | |
vpandn ymm11, ymm2, ymm1 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm0, ymm15, ymm0 | |
vpaddd ymm0, ymm0, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_18] ## ymm9 = [4022224774,4022224774,4022224774,4022224774,4022224774,4022224774,4022224774,4022224774] | |
vpaddd ymm0, ymm0, ymm9 | |
vpaddd ymm9, ymm3, ymm0 | |
vpsrld ymm0, ymm8, 2 | |
vpslld ymm3, ymm8, 30 | |
vpor ymm0, ymm3, ymm0 | |
vpsrld ymm3, ymm8, 13 | |
vpslld ymm11, ymm8, 19 | |
vpor ymm3, ymm11, ymm3 | |
vpxor ymm0, ymm3, ymm0 | |
vpsrld ymm3, ymm8, 22 | |
vpslld ymm11, ymm8, 10 | |
vpor ymm3, ymm11, ymm3 | |
vpxor ymm3, ymm0, ymm3 | |
vpand ymm0, ymm8, ymm7 | |
vpxor ymm4, ymm0, ymm4 | |
vpand ymm11, ymm8, ymm6 | |
vpxor ymm4, ymm4, ymm11 | |
vpaddd ymm4, ymm3, ymm4 | |
vpaddd ymm3, ymm9, ymm10 | |
vpaddd ymm10, ymm4, ymm9 | |
vmovdqa ymmword ptr [rsp + 192], ymm12 ## 32-byte Spill | |
vpsrld ymm4, ymm12, 17 | |
vpslld ymm9, ymm12, 15 | |
vpor ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm12, 19 | |
vpslld ymm11, ymm12, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm12, 10 | |
vpxor ymm4, ymm4, ymm11 | |
vpxor ymm4, ymm4, ymm9 | |
vmovdqa ymm12, ymmword ptr [rsp + 448] ## 32-byte Reload | |
vpsrld ymm9, ymm12, 7 | |
vpslld ymm11, ymm12, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm12, 18 | |
vpslld ymm14, ymm12, 14 | |
vpor ymm11, ymm14, ymm11 | |
vpsrld ymm14, ymm12, 3 | |
vmovdqa ymm13, ymm12 | |
vpxor ymm9, ymm9, ymm14 | |
vpxor ymm9, ymm9, ymm11 | |
vmovdqa ymm11, ymmword ptr [rsp + 96] ## 32-byte Reload | |
vpaddd ymm11, ymm11, ymmword ptr [rsp + 160] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymm11 | |
vpaddd ymm14, ymm9, ymm4 | |
vpsrld ymm4, ymm3, 6 | |
vpslld ymm9, ymm3, 26 | |
vpor ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm3, 11 | |
vpslld ymm11, ymm3, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm3, 25 | |
vpslld ymm11, ymm3, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm4, ymm4, ymm9 | |
vpand ymm9, ymm3, ymm2 | |
vpandn ymm11, ymm3, ymm5 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm1, ymm14, ymm1 | |
vpaddd ymm1, ymm1, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_19] ## ymm9 = [264347078,264347078,264347078,264347078,264347078,264347078,264347078,264347078] | |
vpaddd ymm1, ymm1, ymm9 | |
vpaddd ymm4, ymm4, ymm1 | |
vpsrld ymm1, ymm10, 2 | |
vpslld ymm9, ymm10, 30 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm10, 13 | |
vpslld ymm11, ymm10, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm10, 22 | |
vpslld ymm11, ymm10, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm9, ymm1, ymm9 | |
vpand ymm1, ymm10, ymm8 | |
vpxor ymm0, ymm1, ymm0 | |
vpand ymm11, ymm10, ymm7 | |
vpxor ymm0, ymm0, ymm11 | |
vpaddd ymm9, ymm9, ymm0 | |
vpaddd ymm0, ymm4, ymm6 | |
vpaddd ymm6, ymm9, ymm4 | |
vmovdqa ymmword ptr [rsp + 288], ymm15 ## 32-byte Spill | |
vpsrld ymm4, ymm15, 17 | |
vpslld ymm9, ymm15, 15 | |
vpor ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm4, ymm4, ymm11 | |
vpxor ymm4, ymm4, ymm9 | |
vmovdqa ymm15, ymmword ptr [rsp + 64] ## 32-byte Reload | |
vpsrld ymm9, ymm15, 7 | |
vpslld ymm11, ymm15, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm15, 18 | |
vpslld ymm12, ymm15, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm15, 3 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm11, ymm13, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymm11 | |
vpaddd ymm13, ymm9, ymm4 | |
vpsrld ymm4, ymm0, 6 | |
vpslld ymm9, ymm0, 26 | |
vpor ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm0, 11 | |
vpslld ymm11, ymm0, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm0, 25 | |
vpslld ymm11, ymm0, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm4, ymm4, ymm9 | |
vpand ymm9, ymm0, ymm3 | |
vpandn ymm11, ymm0, ymm2 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm5, ymm13, ymm5 | |
vpaddd ymm5, ymm5, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_20] ## ymm9 = [604807628,604807628,604807628,604807628,604807628,604807628,604807628,604807628] | |
vpaddd ymm5, ymm5, ymm9 | |
vpaddd ymm4, ymm4, ymm5 | |
vpsrld ymm5, ymm6, 2 | |
vpslld ymm9, ymm6, 30 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm6, 13 | |
vpslld ymm11, ymm6, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm6, 22 | |
vpslld ymm11, ymm6, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm9, ymm5, ymm9 | |
vpand ymm5, ymm6, ymm10 | |
vpxor ymm1, ymm5, ymm1 | |
vpand ymm11, ymm6, ymm8 | |
vpxor ymm1, ymm1, ymm11 | |
vpaddd ymm9, ymm9, ymm1 | |
vpaddd ymm1, ymm4, ymm7 | |
vpaddd ymm4, ymm9, ymm4 | |
vmovdqa ymmword ptr [rsp + 96], ymm14 ## 32-byte Spill | |
vpsrld ymm7, ymm14, 17 | |
vpslld ymm9, ymm14, 15 | |
vpor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm9 | |
vmovdqa ymm14, ymmword ptr [rsp + 416] ## 32-byte Reload | |
vpsrld ymm9, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vmovdqa ymm15, ymm14 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vmovdqa ymm11, ymmword ptr [rsp + 64] ## 32-byte Reload | |
vpaddd ymm11, ymm11, ymmword ptr [rsp + 480] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymm11 | |
vpaddd ymm14, ymm9, ymm7 | |
vpsrld ymm7, ymm1, 6 | |
vpslld ymm9, ymm1, 26 | |
vpor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm1, 11 | |
vpslld ymm11, ymm1, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm1, 25 | |
vpslld ymm11, ymm1, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm7, ymm7, ymm9 | |
vpand ymm9, ymm1, ymm0 | |
vpandn ymm11, ymm1, ymm3 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm2, ymm14, ymm2 | |
vpaddd ymm2, ymm2, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_21] ## ymm9 = [770255983,770255983,770255983,770255983,770255983,770255983,770255983,770255983] | |
vpaddd ymm2, ymm2, ymm9 | |
vpaddd ymm9, ymm7, ymm2 | |
vpsrld ymm2, ymm4, 2 | |
vpslld ymm7, ymm4, 30 | |
vpor ymm2, ymm7, ymm2 | |
vpsrld ymm7, ymm4, 13 | |
vpslld ymm11, ymm4, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm2, ymm7, ymm2 | |
vpsrld ymm7, ymm4, 22 | |
vpslld ymm11, ymm4, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm2, ymm2, ymm7 | |
vpand ymm7, ymm4, ymm6 | |
vpxor ymm5, ymm7, ymm5 | |
vpand ymm11, ymm4, ymm10 | |
vpxor ymm5, ymm5, ymm11 | |
vpaddd ymm5, ymm2, ymm5 | |
vpaddd ymm2, ymm9, ymm8 | |
vpaddd ymm8, ymm5, ymm9 | |
vmovdqa ymmword ptr [rsp + 448], ymm13 ## 32-byte Spill | |
vpsrld ymm5, ymm13, 17 | |
vpslld ymm9, ymm13, 15 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm9 | |
vmovdqa ymm13, ymmword ptr [rsp + 384] ## 32-byte Reload | |
vpsrld ymm9, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm11, ymm15, ymmword ptr [rsp + 320] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymm11 | |
vpaddd ymm15, ymm9, ymm5 | |
vpsrld ymm5, ymm2, 6 | |
vpslld ymm9, ymm2, 26 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm2, 11 | |
vpslld ymm11, ymm2, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm2, 25 | |
vpslld ymm11, ymm2, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm5, ymm9 | |
vpand ymm9, ymm2, ymm1 | |
vpandn ymm11, ymm2, ymm0 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm3, ymm15, ymm3 | |
vpaddd ymm3, ymm3, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_22] ## ymm9 = [1249150122,1249150122,1249150122,1249150122,1249150122,1249150122,1249150122,1249150122] | |
vpaddd ymm3, ymm3, ymm9 | |
vpaddd ymm5, ymm5, ymm3 | |
vpsrld ymm3, ymm8, 2 | |
vpslld ymm9, ymm8, 30 | |
vpor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm8, 13 | |
vpslld ymm11, ymm8, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm3, ymm9, ymm3 | |
vpsrld ymm9, ymm8, 22 | |
vpslld ymm11, ymm8, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm9, ymm3, ymm9 | |
vpand ymm3, ymm8, ymm4 | |
vpxor ymm7, ymm3, ymm7 | |
vpand ymm11, ymm8, ymm6 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm9, ymm7 | |
vpaddd ymm10, ymm5, ymm10 | |
vpaddd ymm9, ymm7, ymm5 | |
vmovdqa ymmword ptr [rsp + 64], ymm14 ## 32-byte Spill | |
vpsrld ymm5, ymm14, 17 | |
vpslld ymm7, ymm14, 15 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm7 | |
vmovdqa ymm13, ymmword ptr [rsp] ## 32-byte Reload | |
vpsrld ymm7, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm7, ymm7, ymm12 | |
vpxor ymm7, ymm7, ymm11 | |
vmovdqa ymm11, ymmword ptr [rsp + 384] ## 32-byte Reload | |
vpaddd ymm11, ymm11, ymmword ptr [rsp + 256] ## 32-byte Folded Reload | |
vpaddd ymm7, ymm7, ymm11 | |
vpaddd ymm14, ymm7, ymm5 | |
vpsrld ymm5, ymm10, 6 | |
vpslld ymm7, ymm10, 26 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm10, 11 | |
vpslld ymm11, ymm10, 21 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm10, 25 | |
vpslld ymm11, ymm10, 7 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm5, ymm7 | |
vpand ymm7, ymm10, ymm2 | |
vpandn ymm11, ymm10, ymm1 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm0, ymm14, ymm0 | |
vpaddd ymm0, ymm0, ymm7 | |
vpbroadcastd ymm7, dword ptr [rip + LCPI2_23] ## ymm7 = [1555081692,1555081692,1555081692,1555081692,1555081692,1555081692,1555081692,1555081692] | |
vpaddd ymm0, ymm0, ymm7 | |
vpaddd ymm5, ymm5, ymm0 | |
vpsrld ymm0, ymm9, 2 | |
vpslld ymm7, ymm9, 30 | |
vpor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm9, 13 | |
vpslld ymm11, ymm9, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm9, 22 | |
vpslld ymm11, ymm9, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm7, ymm0, ymm7 | |
vpand ymm0, ymm9, ymm8 | |
vpxor ymm3, ymm0, ymm3 | |
vpand ymm11, ymm9, ymm4 | |
vpxor ymm3, ymm3, ymm11 | |
vpaddd ymm3, ymm7, ymm3 | |
vpaddd ymm6, ymm5, ymm6 | |
vpaddd ymm3, ymm3, ymm5 | |
vmovdqa ymmword ptr [rsp + 416], ymm15 ## 32-byte Spill | |
vpsrld ymm5, ymm15, 17 | |
vpslld ymm7, ymm15, 15 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm7 | |
vmovdqa ymm13, ymmword ptr [rsp + 352] ## 32-byte Reload | |
vpsrld ymm7, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm7, ymm7, ymm12 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm7, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 192] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm7, ymm5 | |
vpsrld ymm5, ymm6, 6 | |
vpslld ymm7, ymm6, 26 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm6, 11 | |
vpslld ymm11, ymm6, 21 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm6, 25 | |
vpslld ymm11, ymm6, 7 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm5, ymm7 | |
vpand ymm7, ymm6, ymm10 | |
vpandn ymm11, ymm6, ymm2 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm1, ymm15, ymm1 | |
vpaddd ymm1, ymm1, ymm7 | |
vpbroadcastd ymm7, dword ptr [rip + LCPI2_24] ## ymm7 = [1996064986,1996064986,1996064986,1996064986,1996064986,1996064986,1996064986,1996064986] | |
vpaddd ymm1, ymm1, ymm7 | |
vpaddd ymm5, ymm5, ymm1 | |
vpsrld ymm1, ymm3, 2 | |
vpslld ymm7, ymm3, 30 | |
vpor ymm1, ymm7, ymm1 | |
vpsrld ymm7, ymm3, 13 | |
vpslld ymm11, ymm3, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm1, ymm7, ymm1 | |
vpsrld ymm7, ymm3, 22 | |
vpslld ymm11, ymm3, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm7, ymm1, ymm7 | |
vpand ymm1, ymm3, ymm9 | |
vpxor ymm0, ymm1, ymm0 | |
vpand ymm11, ymm3, ymm8 | |
vpxor ymm0, ymm0, ymm11 | |
vpaddd ymm0, ymm7, ymm0 | |
vpaddd ymm4, ymm5, ymm4 | |
vpaddd ymm0, ymm0, ymm5 | |
vmovdqa ymmword ptr [rsp + 384], ymm14 ## 32-byte Spill | |
vpsrld ymm5, ymm14, 17 | |
vpslld ymm7, ymm14, 15 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm7 | |
vmovdqa ymm13, ymmword ptr [rsp + 224] ## 32-byte Reload | |
vpsrld ymm7, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm7, ymm7, ymm12 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 352] ## 32-byte Folded Reload | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 288] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm7, ymm5 | |
vpsrld ymm5, ymm4, 6 | |
vpslld ymm7, ymm4, 26 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm4, 11 | |
vpslld ymm11, ymm4, 21 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm4, 25 | |
vpslld ymm11, ymm4, 7 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm5, ymm7 | |
vpand ymm7, ymm4, ymm6 | |
vpandn ymm11, ymm4, ymm10 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm2, ymm14, ymm2 | |
vpaddd ymm2, ymm2, ymm7 | |
vpbroadcastd ymm7, dword ptr [rip + LCPI2_25] ## ymm7 = [2554220882,2554220882,2554220882,2554220882,2554220882,2554220882,2554220882,2554220882] | |
vpaddd ymm2, ymm2, ymm7 | |
vpaddd ymm5, ymm5, ymm2 | |
vpsrld ymm2, ymm0, 2 | |
vpslld ymm7, ymm0, 30 | |
vpor ymm2, ymm7, ymm2 | |
vpsrld ymm7, ymm0, 13 | |
vpslld ymm11, ymm0, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm2, ymm7, ymm2 | |
vpsrld ymm7, ymm0, 22 | |
vpslld ymm11, ymm0, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm7, ymm2, ymm7 | |
vpand ymm2, ymm0, ymm3 | |
vpxor ymm1, ymm2, ymm1 | |
vpand ymm11, ymm0, ymm9 | |
vpxor ymm1, ymm1, ymm11 | |
vpaddd ymm1, ymm7, ymm1 | |
vpaddd ymm8, ymm5, ymm8 | |
vpaddd ymm1, ymm1, ymm5 | |
vmovdqa ymmword ptr [rsp], ymm15 ## 32-byte Spill | |
vpsrld ymm5, ymm15, 17 | |
vpslld ymm7, ymm15, 15 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm7 | |
vmovdqa ymm13, ymmword ptr [rsp + 128] ## 32-byte Reload | |
vpsrld ymm7, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm7, ymm7, ymm12 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 224] ## 32-byte Folded Reload | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 96] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm7, ymm5 | |
vpsrld ymm5, ymm8, 6 | |
vpslld ymm7, ymm8, 26 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm8, 11 | |
vpslld ymm11, ymm8, 21 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm8, 25 | |
vpslld ymm11, ymm8, 7 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm5, ymm5, ymm7 | |
vpand ymm7, ymm8, ymm4 | |
vpandn ymm11, ymm8, ymm6 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm10, ymm15, ymm10 | |
vpaddd ymm7, ymm10, ymm7 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_26] ## ymm10 = [2821834349,2821834349,2821834349,2821834349,2821834349,2821834349,2821834349,2821834349] | |
vpaddd ymm7, ymm7, ymm10 | |
vpaddd ymm7, ymm5, ymm7 | |
vpsrld ymm5, ymm1, 2 | |
vpslld ymm10, ymm1, 30 | |
vpor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm1, 13 | |
vpslld ymm11, ymm1, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm1, 22 | |
vpslld ymm11, ymm1, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm5, ymm10 | |
vpand ymm5, ymm1, ymm0 | |
vpxor ymm2, ymm5, ymm2 | |
vpand ymm11, ymm1, ymm3 | |
vpxor ymm2, ymm2, ymm11 | |
vpaddd ymm2, ymm10, ymm2 | |
vpaddd ymm9, ymm7, ymm9 | |
vpaddd ymm2, ymm2, ymm7 | |
vmovdqa ymmword ptr [rsp + 512], ymm14 ## 32-byte Spill | |
vpsrld ymm7, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 160] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 128] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 448] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm7 | |
vpsrld ymm7, ymm9, 6 | |
vpslld ymm10, ymm9, 26 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm9, 11 | |
vpslld ymm11, ymm9, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm9, 25 | |
vpslld ymm11, ymm9, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm7, ymm7, ymm10 | |
vpand ymm10, ymm9, ymm8 | |
vpandn ymm11, ymm9, ymm4 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm6, ymm14, ymm6 | |
vpaddd ymm6, ymm6, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_27] ## ymm10 = [2952996808,2952996808,2952996808,2952996808,2952996808,2952996808,2952996808,2952996808] | |
vpaddd ymm6, ymm6, ymm10 | |
vpaddd ymm10, ymm7, ymm6 | |
vpsrld ymm6, ymm2, 2 | |
vpslld ymm7, ymm2, 30 | |
vpor ymm6, ymm7, ymm6 | |
vpsrld ymm7, ymm2, 13 | |
vpslld ymm11, ymm2, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm6, ymm7, ymm6 | |
vpsrld ymm7, ymm2, 22 | |
vpslld ymm11, ymm2, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm6, ymm6, ymm7 | |
vpand ymm7, ymm2, ymm1 | |
vpxor ymm5, ymm7, ymm5 | |
vpand ymm11, ymm2, ymm0 | |
vpxor ymm5, ymm5, ymm11 | |
vpaddd ymm5, ymm6, ymm5 | |
vpaddd ymm6, ymm10, ymm3 | |
vpaddd ymm3, ymm5, ymm10 | |
vmovdqa ymmword ptr [rsp + 608], ymm15 ## 32-byte Spill | |
vpsrld ymm5, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 32] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 64] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm5 | |
vpsrld ymm5, ymm6, 6 | |
vpslld ymm10, ymm6, 26 | |
vpor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm6, 11 | |
vpslld ymm11, ymm6, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm6, 25 | |
vpslld ymm11, ymm6, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm5, ymm5, ymm10 | |
vpand ymm10, ymm6, ymm9 | |
vpandn ymm11, ymm6, ymm8 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm4, ymm15, ymm4 | |
vpaddd ymm4, ymm4, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_28] ## ymm10 = [3210313671,3210313671,3210313671,3210313671,3210313671,3210313671,3210313671,3210313671] | |
vpaddd ymm4, ymm4, ymm10 | |
vpaddd ymm5, ymm5, ymm4 | |
vpsrld ymm4, ymm3, 2 | |
vpslld ymm10, ymm3, 30 | |
vpor ymm4, ymm10, ymm4 | |
vpsrld ymm10, ymm3, 13 | |
vpslld ymm11, ymm3, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm4, ymm10, ymm4 | |
vpsrld ymm10, ymm3, 22 | |
vpslld ymm11, ymm3, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm4, ymm4, ymm10 | |
vpand ymm10, ymm3, ymm2 | |
vpxor ymm7, ymm10, ymm7 | |
vpand ymm11, ymm3, ymm1 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm4, ymm7 | |
vpaddd ymm4, ymm5, ymm0 | |
vpaddd ymm5, ymm7, ymm5 | |
vmovdqa ymmword ptr [rsp + 128], ymm14 ## 32-byte Spill | |
vpsrld ymm0, ymm14, 17 | |
vpslld ymm7, ymm14, 15 | |
vpor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm0, ymm0, ymm11 | |
vpxor ymm0, ymm0, ymm7 | |
vmovdqa ymm14, ymmword ptr [rsp + 480] ## 32-byte Reload | |
vpsrld ymm7, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm7, ymm11, ymm7 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm7, ymm7, ymm12 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 416] ## 32-byte Folded Reload | |
vpaddd ymm11, ymm7, ymm0 | |
vmovdqa ymmword ptr [rsp + 32], ymm11 ## 32-byte Spill | |
vpsrld ymm0, ymm4, 6 | |
vpslld ymm7, ymm4, 26 | |
vpor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm4, 11 | |
vpslld ymm12, ymm4, 21 | |
vpor ymm7, ymm12, ymm7 | |
vpxor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm4, 25 | |
vpslld ymm12, ymm4, 7 | |
vpor ymm7, ymm12, ymm7 | |
vpxor ymm0, ymm0, ymm7 | |
vpand ymm7, ymm4, ymm6 | |
vpandn ymm12, ymm4, ymm9 | |
vpxor ymm7, ymm7, ymm12 | |
vpaddd ymm8, ymm11, ymm8 | |
vpaddd ymm7, ymm8, ymm7 | |
vpbroadcastd ymm8, dword ptr [rip + LCPI2_29] ## ymm8 = [3336571891,3336571891,3336571891,3336571891,3336571891,3336571891,3336571891,3336571891] | |
vpaddd ymm7, ymm7, ymm8 | |
vpaddd ymm7, ymm0, ymm7 | |
vpsrld ymm0, ymm5, 2 | |
vpslld ymm8, ymm5, 30 | |
vpor ymm0, ymm8, ymm0 | |
vpsrld ymm8, ymm5, 13 | |
vpslld ymm12, ymm5, 19 | |
vpor ymm8, ymm12, ymm8 | |
vpxor ymm0, ymm8, ymm0 | |
vpsrld ymm8, ymm5, 22 | |
vpslld ymm12, ymm5, 10 | |
vpor ymm8, ymm12, ymm8 | |
vpxor ymm0, ymm0, ymm8 | |
vpand ymm8, ymm5, ymm3 | |
vpxor ymm10, ymm8, ymm10 | |
vpand ymm12, ymm5, ymm2 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm10, ymm0, ymm10 | |
vpaddd ymm0, ymm7, ymm1 | |
vpaddd ymm7, ymm10, ymm7 | |
vmovdqa ymmword ptr [rsp + 576], ymm15 ## 32-byte Spill | |
vpsrld ymm1, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm12, ymm15, 13 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm15, 10 | |
vpxor ymm1, ymm1, ymm12 | |
vpxor ymm1, ymm1, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 320] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm12, ymm13, 25 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm13, 18 | |
vpslld ymm11, ymm13, 14 | |
vpor ymm11, ymm11, ymm12 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 384] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm1 | |
vpsrld ymm1, ymm0, 6 | |
vpslld ymm10, ymm0, 26 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm0, 11 | |
vpslld ymm11, ymm0, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm0, 25 | |
vpslld ymm11, ymm0, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm1, ymm1, ymm10 | |
vpand ymm10, ymm0, ymm4 | |
vpandn ymm11, ymm0, ymm6 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm9, ymm14, ymm9 | |
vpaddd ymm9, ymm9, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_30] ## ymm10 = [3584528711,3584528711,3584528711,3584528711,3584528711,3584528711,3584528711,3584528711] | |
vpaddd ymm9, ymm9, ymm10 | |
vpaddd ymm10, ymm1, ymm9 | |
vpsrld ymm1, ymm7, 2 | |
vpslld ymm9, ymm7, 30 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm7, 13 | |
vpslld ymm11, ymm7, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm7, 22 | |
vpslld ymm11, ymm7, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm1, ymm9 | |
vpand ymm9, ymm7, ymm5 | |
vpxor ymm8, ymm9, ymm8 | |
vpand ymm11, ymm7, ymm3 | |
vpxor ymm8, ymm8, ymm11 | |
vpaddd ymm8, ymm1, ymm8 | |
vpaddd ymm1, ymm10, ymm2 | |
vpaddd ymm8, ymm8, ymm10 | |
vmovdqa ymm12, ymmword ptr [rsp + 32] ## 32-byte Reload | |
vpsrld ymm2, ymm12, 17 | |
vpslld ymm10, ymm12, 15 | |
vpor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm12, 19 | |
vpslld ymm11, ymm12, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm12, 10 | |
vpxor ymm2, ymm2, ymm11 | |
vpxor ymm2, ymm2, ymm10 | |
vmovdqa ymm15, ymmword ptr [rsp + 256] ## 32-byte Reload | |
vpsrld ymm10, ymm15, 7 | |
vpslld ymm11, ymm15, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 18 | |
vpslld ymm12, ymm15, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm15, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm13 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm2 | |
vpsrld ymm2, ymm1, 6 | |
vpslld ymm10, ymm1, 26 | |
vpor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm1, 11 | |
vpslld ymm11, ymm1, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm1, 25 | |
vpslld ymm11, ymm1, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm2, ymm2, ymm10 | |
vpand ymm10, ymm1, ymm0 | |
vpandn ymm11, ymm1, ymm4 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm6, ymm15, ymm6 | |
vpaddd ymm6, ymm6, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_31] ## ymm10 = [113926993,113926993,113926993,113926993,113926993,113926993,113926993,113926993] | |
vpaddd ymm6, ymm6, ymm10 | |
vpaddd ymm10, ymm2, ymm6 | |
vpsrld ymm2, ymm8, 2 | |
vpslld ymm6, ymm8, 30 | |
vpor ymm2, ymm6, ymm2 | |
vpsrld ymm6, ymm8, 13 | |
vpslld ymm11, ymm8, 19 | |
vpor ymm6, ymm11, ymm6 | |
vpxor ymm2, ymm6, ymm2 | |
vpsrld ymm6, ymm8, 22 | |
vpslld ymm11, ymm8, 10 | |
vpor ymm6, ymm11, ymm6 | |
vpxor ymm6, ymm2, ymm6 | |
vpand ymm2, ymm8, ymm7 | |
vpxor ymm9, ymm2, ymm9 | |
vpand ymm11, ymm8, ymm5 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm6, ymm9 | |
vpaddd ymm6, ymm10, ymm3 | |
vpaddd ymm3, ymm9, ymm10 | |
vmovdqa ymmword ptr [rsp + 544], ymm14 ## 32-byte Spill | |
vpsrld ymm9, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 192] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 256] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 512] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm10, ymm9 | |
vpsrld ymm9, ymm6, 6 | |
vpslld ymm10, ymm6, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm6, 11 | |
vpslld ymm11, ymm6, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm6, 25 | |
vpslld ymm11, ymm6, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm6, ymm1 | |
vpandn ymm11, ymm6, ymm0 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm4, ymm13, ymm4 | |
vpaddd ymm4, ymm4, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_32] ## ymm10 = [338241895,338241895,338241895,338241895,338241895,338241895,338241895,338241895] | |
vpaddd ymm4, ymm4, ymm10 | |
vpaddd ymm4, ymm9, ymm4 | |
vpsrld ymm9, ymm3, 2 | |
vpslld ymm10, ymm3, 30 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm3, 13 | |
vpslld ymm11, ymm3, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm3, 22 | |
vpslld ymm11, ymm3, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm9, ymm10 | |
vpand ymm9, ymm3, ymm8 | |
vpxor ymm2, ymm9, ymm2 | |
vpand ymm11, ymm3, ymm7 | |
vpxor ymm2, ymm2, ymm11 | |
vpaddd ymm10, ymm10, ymm2 | |
vpaddd ymm2, ymm4, ymm5 | |
vpaddd ymm4, ymm10, ymm4 | |
vmovdqa ymmword ptr [rsp + 320], ymm15 ## 32-byte Spill | |
vpsrld ymm5, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp + 288] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 192] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 608] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm5 | |
vpsrld ymm5, ymm2, 6 | |
vpslld ymm10, ymm2, 26 | |
vpor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm2, 11 | |
vpslld ymm11, ymm2, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm2, 25 | |
vpslld ymm11, ymm2, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm5, ymm5, ymm10 | |
vpand ymm10, ymm2, ymm6 | |
vpandn ymm11, ymm2, ymm1 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm0, ymm15, ymm0 | |
vpaddd ymm0, ymm0, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_33] ## ymm10 = [666307205,666307205,666307205,666307205,666307205,666307205,666307205,666307205] | |
vpaddd ymm0, ymm0, ymm10 | |
vpaddd ymm5, ymm5, ymm0 | |
vpsrld ymm0, ymm4, 2 | |
vpslld ymm10, ymm4, 30 | |
vpor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm4, 13 | |
vpslld ymm11, ymm4, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm4, 22 | |
vpslld ymm11, ymm4, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm0, ymm0, ymm10 | |
vpand ymm10, ymm4, ymm3 | |
vpxor ymm9, ymm10, ymm9 | |
vpand ymm11, ymm4, ymm8 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm0, ymm9 | |
vpaddd ymm0, ymm5, ymm7 | |
vpaddd ymm5, ymm9, ymm5 | |
vmovdqa ymmword ptr [rsp + 160], ymm13 ## 32-byte Spill | |
vpsrld ymm7, ymm13, 17 | |
vpslld ymm9, ymm13, 15 | |
vpor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm9 | |
vmovdqa ymm13, ymmword ptr [rsp + 96] ## 32-byte Reload | |
vpsrld ymm9, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm9, ymm14 | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 128] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm9, ymm7 | |
vpsrld ymm7, ymm0, 6 | |
vpslld ymm9, ymm0, 26 | |
vpor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm0, 11 | |
vpslld ymm11, ymm0, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm7, ymm9, ymm7 | |
vpsrld ymm9, ymm0, 25 | |
vpslld ymm11, ymm0, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm7, ymm7, ymm9 | |
vpand ymm9, ymm0, ymm2 | |
vpandn ymm11, ymm0, ymm6 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm1, ymm13, ymm1 | |
vpaddd ymm1, ymm1, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_34] ## ymm9 = [773529912,773529912,773529912,773529912,773529912,773529912,773529912,773529912] | |
vpaddd ymm1, ymm1, ymm9 | |
vpaddd ymm7, ymm7, ymm1 | |
vpsrld ymm1, ymm5, 2 | |
vpslld ymm9, ymm5, 30 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm5, 13 | |
vpslld ymm11, ymm5, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm5, 22 | |
vpslld ymm11, ymm5, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm1, ymm9 | |
vpand ymm9, ymm5, ymm4 | |
vpxor ymm10, ymm9, ymm10 | |
vpand ymm11, ymm5, ymm3 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm1, ymm10 | |
vpaddd ymm1, ymm7, ymm8 | |
vpaddd ymm7, ymm10, ymm7 | |
vmovdqa ymmword ptr [rsp + 192], ymm15 ## 32-byte Spill | |
vpsrld ymm8, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm8, ymm8, ymm11 | |
vpxor ymm8, ymm8, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp + 448] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 96] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 576] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm8 | |
vpsrld ymm8, ymm1, 6 | |
vpslld ymm10, ymm1, 26 | |
vpor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm1, 11 | |
vpslld ymm11, ymm1, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm1, 25 | |
vpslld ymm11, ymm1, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm8, ymm8, ymm10 | |
vpand ymm10, ymm1, ymm0 | |
vpandn ymm11, ymm1, ymm2 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm6, ymm15, ymm6 | |
vpaddd ymm6, ymm6, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_35] ## ymm10 = [1294757372,1294757372,1294757372,1294757372,1294757372,1294757372,1294757372,1294757372] | |
vpaddd ymm6, ymm6, ymm10 | |
vpaddd ymm6, ymm8, ymm6 | |
vpsrld ymm8, ymm7, 2 | |
vpslld ymm10, ymm7, 30 | |
vpor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm7, 13 | |
vpslld ymm11, ymm7, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm7, 22 | |
vpslld ymm11, ymm7, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm8, ymm10 | |
vpand ymm8, ymm7, ymm5 | |
vpxor ymm9, ymm8, ymm9 | |
vpand ymm11, ymm7, ymm4 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm10, ymm9 | |
vpaddd ymm3, ymm6, ymm3 | |
vpaddd ymm6, ymm9, ymm6 | |
vmovdqa ymmword ptr [rsp + 288], ymm13 ## 32-byte Spill | |
vpsrld ymm9, ymm13, 17 | |
vpslld ymm10, ymm13, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 64] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm10, ymm9 | |
vpsrld ymm9, ymm3, 6 | |
vpslld ymm10, ymm3, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm3, 11 | |
vpslld ymm11, ymm3, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm3, 25 | |
vpslld ymm11, ymm3, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm3, ymm1 | |
vpandn ymm11, ymm3, ymm0 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm2, ymm13, ymm2 | |
vpaddd ymm2, ymm2, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_36] ## ymm10 = [1396182291,1396182291,1396182291,1396182291,1396182291,1396182291,1396182291,1396182291] | |
vpaddd ymm2, ymm2, ymm10 | |
vpaddd ymm10, ymm9, ymm2 | |
vpsrld ymm2, ymm6, 2 | |
vpslld ymm9, ymm6, 30 | |
vpor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm6, 13 | |
vpslld ymm11, ymm6, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm6, 22 | |
vpslld ymm11, ymm6, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm2, ymm2, ymm9 | |
vpand ymm9, ymm6, ymm7 | |
vpxor ymm8, ymm9, ymm8 | |
vpand ymm11, ymm6, ymm5 | |
vpxor ymm8, ymm8, ymm11 | |
vpaddd ymm8, ymm2, ymm8 | |
vpaddd ymm2, ymm10, ymm4 | |
vpaddd ymm8, ymm8, ymm10 | |
vmovdqa ymmword ptr [rsp + 96], ymm15 ## 32-byte Spill | |
vpsrld ymm4, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm4, ymm10, ymm4 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm4, ymm4, ymm11 | |
vpxor ymm4, ymm4, ymm10 | |
vmovdqa ymm15, ymmword ptr [rsp + 416] ## 32-byte Reload | |
vpsrld ymm10, ymm15, 7 | |
vpslld ymm11, ymm15, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 18 | |
vpslld ymm12, ymm15, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm15, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 64] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 544] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm4 | |
vpsrld ymm4, ymm2, 6 | |
vpslld ymm10, ymm2, 26 | |
vpor ymm4, ymm10, ymm4 | |
vpsrld ymm10, ymm2, 11 | |
vpslld ymm11, ymm2, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm4, ymm10, ymm4 | |
vpsrld ymm10, ymm2, 25 | |
vpslld ymm11, ymm2, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm4, ymm4, ymm10 | |
vpand ymm10, ymm2, ymm3 | |
vpandn ymm11, ymm2, ymm1 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm0, ymm14, ymm0 | |
vpaddd ymm0, ymm0, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_37] ## ymm10 = [1695183700,1695183700,1695183700,1695183700,1695183700,1695183700,1695183700,1695183700] | |
vpaddd ymm0, ymm0, ymm10 | |
vpaddd ymm4, ymm4, ymm0 | |
vpsrld ymm0, ymm8, 2 | |
vpslld ymm10, ymm8, 30 | |
vpor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm8, 13 | |
vpslld ymm11, ymm8, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm8, 22 | |
vpslld ymm11, ymm8, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm0, ymm0, ymm10 | |
vpand ymm10, ymm8, ymm6 | |
vpxor ymm9, ymm10, ymm9 | |
vpand ymm11, ymm8, ymm7 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm0, ymm9 | |
vpaddd ymm0, ymm4, ymm5 | |
vpaddd ymm4, ymm9, ymm4 | |
vmovdqa ymmword ptr [rsp + 256], ymm13 ## 32-byte Spill | |
vpsrld ymm5, ymm13, 17 | |
vpslld ymm9, ymm13, 15 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm9 | |
vmovdqa ymm13, ymmword ptr [rsp + 384] ## 32-byte Reload | |
vpsrld ymm9, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm9, ymm15 | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 320] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm9, ymm5 | |
vpsrld ymm5, ymm0, 6 | |
vpslld ymm9, ymm0, 26 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm0, 11 | |
vpslld ymm11, ymm0, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm0, 25 | |
vpslld ymm11, ymm0, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm5, ymm9 | |
vpand ymm9, ymm0, ymm2 | |
vpandn ymm11, ymm0, ymm3 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm1, ymm15, ymm1 | |
vpaddd ymm1, ymm1, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_38] ## ymm9 = [1986661051,1986661051,1986661051,1986661051,1986661051,1986661051,1986661051,1986661051] | |
vpaddd ymm1, ymm1, ymm9 | |
vpaddd ymm5, ymm5, ymm1 | |
vpsrld ymm1, ymm4, 2 | |
vpslld ymm9, ymm4, 30 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm4, 13 | |
vpslld ymm11, ymm4, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm4, 22 | |
vpslld ymm11, ymm4, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm1, ymm9 | |
vpand ymm9, ymm4, ymm8 | |
vpxor ymm10, ymm9, ymm10 | |
vpand ymm11, ymm4, ymm6 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm1, ymm10 | |
vpaddd ymm1, ymm5, ymm7 | |
vpaddd ymm5, ymm10, ymm5 | |
vmovdqa ymmword ptr [rsp + 224], ymm14 ## 32-byte Spill | |
vpsrld ymm7, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm13 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm7 | |
vpsrld ymm7, ymm1, 6 | |
vpslld ymm10, ymm1, 26 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm1, 11 | |
vpslld ymm11, ymm1, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm1, 25 | |
vpslld ymm11, ymm1, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm7, ymm7, ymm10 | |
vpand ymm10, ymm1, ymm0 | |
vpandn ymm11, ymm1, ymm2 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm3, ymm14, ymm3 | |
vpaddd ymm3, ymm3, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_39] ## ymm10 = [2177026350,2177026350,2177026350,2177026350,2177026350,2177026350,2177026350,2177026350] | |
vpaddd ymm3, ymm3, ymm10 | |
vpaddd ymm7, ymm7, ymm3 | |
vpsrld ymm3, ymm5, 2 | |
vpslld ymm10, ymm5, 30 | |
vpor ymm3, ymm10, ymm3 | |
vpsrld ymm10, ymm5, 13 | |
vpslld ymm11, ymm5, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm3, ymm10, ymm3 | |
vpsrld ymm10, ymm5, 22 | |
vpslld ymm11, ymm5, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm3, ymm3, ymm10 | |
vpand ymm10, ymm5, ymm4 | |
vpxor ymm9, ymm10, ymm9 | |
vpand ymm11, ymm5, ymm8 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm3, ymm9 | |
vpaddd ymm3, ymm7, ymm6 | |
vpaddd ymm7, ymm9, ymm7 | |
vmovdqa ymmword ptr [rsp + 416], ymm15 ## 32-byte Spill | |
vpsrld ymm6, ymm15, 17 | |
vpslld ymm9, ymm15, 15 | |
vpor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm6, ymm6, ymm11 | |
vpxor ymm6, ymm6, ymm9 | |
vmovdqa ymm13, ymmword ptr [rsp + 512] ## 32-byte Reload | |
vpsrld ymm9, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vmovdqa ymm15, ymm13 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm9, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 192] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm9, ymm6 | |
vpsrld ymm6, ymm3, 6 | |
vpslld ymm9, ymm3, 26 | |
vpor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm3, 11 | |
vpslld ymm11, ymm3, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm6, ymm9, ymm6 | |
vpsrld ymm9, ymm3, 25 | |
vpslld ymm11, ymm3, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm6, ymm6, ymm9 | |
vpand ymm9, ymm3, ymm1 | |
vpandn ymm11, ymm3, ymm0 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm2, ymm13, ymm2 | |
vpaddd ymm2, ymm2, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_40] ## ymm9 = [2456956037,2456956037,2456956037,2456956037,2456956037,2456956037,2456956037,2456956037] | |
vpaddd ymm2, ymm2, ymm9 | |
vpaddd ymm6, ymm6, ymm2 | |
vpsrld ymm2, ymm7, 2 | |
vpslld ymm9, ymm7, 30 | |
vpor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm7, 13 | |
vpslld ymm11, ymm7, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm7, 22 | |
vpslld ymm11, ymm7, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm9, ymm2, ymm9 | |
vpand ymm2, ymm7, ymm5 | |
vpxor ymm10, ymm2, ymm10 | |
vpand ymm11, ymm7, ymm4 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm9, ymm9, ymm10 | |
vpaddd ymm8, ymm6, ymm8 | |
vpaddd ymm6, ymm9, ymm6 | |
vmovdqa ymmword ptr [rsp + 352], ymm14 ## 32-byte Spill | |
vpsrld ymm9, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp + 608] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm15 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 288] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm9 | |
vpsrld ymm9, ymm8, 6 | |
vpslld ymm10, ymm8, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm8, 11 | |
vpslld ymm11, ymm8, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm8, 25 | |
vpslld ymm11, ymm8, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm8, ymm3 | |
vpandn ymm11, ymm8, ymm1 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm0, ymm15, ymm0 | |
vpaddd ymm0, ymm0, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_41] ## ymm10 = [2730485921,2730485921,2730485921,2730485921,2730485921,2730485921,2730485921,2730485921] | |
vpaddd ymm0, ymm0, ymm10 | |
vpaddd ymm10, ymm9, ymm0 | |
vpsrld ymm0, ymm6, 2 | |
vpslld ymm9, ymm6, 30 | |
vpor ymm0, ymm9, ymm0 | |
vpsrld ymm9, ymm6, 13 | |
vpslld ymm11, ymm6, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm0, ymm9, ymm0 | |
vpsrld ymm9, ymm6, 22 | |
vpslld ymm11, ymm6, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm0, ymm0, ymm9 | |
vpand ymm9, ymm6, ymm7 | |
vpxor ymm2, ymm9, ymm2 | |
vpand ymm11, ymm6, ymm5 | |
vpxor ymm2, ymm2, ymm11 | |
vpaddd ymm2, ymm0, ymm2 | |
vpaddd ymm0, ymm10, ymm4 | |
vpaddd ymm4, ymm2, ymm10 | |
vmovdqa ymmword ptr [rsp + 64], ymm13 ## 32-byte Spill | |
vpsrld ymm2, ymm13, 17 | |
vpslld ymm10, ymm13, 15 | |
vpor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm2, ymm2, ymm11 | |
vpxor ymm2, ymm2, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 128] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 96] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm10, ymm2 | |
vpsrld ymm2, ymm0, 6 | |
vpslld ymm10, ymm0, 26 | |
vpor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm0, 11 | |
vpslld ymm11, ymm0, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm0, 25 | |
vpslld ymm11, ymm0, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm2, ymm2, ymm10 | |
vpand ymm10, ymm0, ymm8 | |
vpandn ymm11, ymm0, ymm3 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm1, ymm13, ymm1 | |
vpaddd ymm1, ymm1, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_42] ## ymm10 = [2820302411,2820302411,2820302411,2820302411,2820302411,2820302411,2820302411,2820302411] | |
vpaddd ymm1, ymm1, ymm10 | |
vpaddd ymm2, ymm2, ymm1 | |
vpsrld ymm1, ymm4, 2 | |
vpslld ymm10, ymm4, 30 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm4, 13 | |
vpslld ymm11, ymm4, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm4, 22 | |
vpslld ymm11, ymm4, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm1, ymm1, ymm10 | |
vpand ymm10, ymm4, ymm6 | |
vpxor ymm9, ymm10, ymm9 | |
vpand ymm11, ymm4, ymm7 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm1, ymm9 | |
vpaddd ymm1, ymm2, ymm5 | |
vpaddd ymm2, ymm9, ymm2 | |
vmovdqa ymmword ptr [rsp], ymm15 ## 32-byte Spill | |
vpsrld ymm5, ymm15, 17 | |
vpslld ymm9, ymm15, 15 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm5, ymm5, ymm11 | |
vpxor ymm5, ymm5, ymm9 | |
vmovdqa ymm14, ymmword ptr [rsp + 576] ## 32-byte Reload | |
vpsrld ymm9, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 128] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 256] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm9, ymm5 | |
vpsrld ymm5, ymm1, 6 | |
vpslld ymm9, ymm1, 26 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm1, 11 | |
vpslld ymm11, ymm1, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm1, 25 | |
vpslld ymm11, ymm1, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm5, ymm9 | |
vpand ymm9, ymm1, ymm0 | |
vpandn ymm11, ymm1, ymm8 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm3, ymm15, ymm3 | |
vpaddd ymm3, ymm3, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_43] ## ymm9 = [3259730800,3259730800,3259730800,3259730800,3259730800,3259730800,3259730800,3259730800] | |
vpaddd ymm3, ymm3, ymm9 | |
vpaddd ymm3, ymm5, ymm3 | |
vpsrld ymm5, ymm2, 2 | |
vpslld ymm9, ymm2, 30 | |
vpor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm2, 13 | |
vpslld ymm11, ymm2, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm5, ymm9, ymm5 | |
vpsrld ymm9, ymm2, 22 | |
vpslld ymm11, ymm2, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm9, ymm5, ymm9 | |
vpand ymm5, ymm2, ymm4 | |
vpxor ymm10, ymm5, ymm10 | |
vpand ymm11, ymm2, ymm6 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm9, ymm9, ymm10 | |
vpaddd ymm7, ymm3, ymm7 | |
vpaddd ymm3, ymm9, ymm3 | |
vmovdqa ymmword ptr [rsp + 480], ymm13 ## 32-byte Spill | |
vpsrld ymm9, ymm13, 17 | |
vpslld ymm10, ymm13, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 32] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 224] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm9 | |
vpsrld ymm9, ymm7, 6 | |
vpslld ymm10, ymm7, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm7, 11 | |
vpslld ymm11, ymm7, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm7, 25 | |
vpslld ymm11, ymm7, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm7, ymm1 | |
vpandn ymm11, ymm7, ymm0 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm8, ymm14, ymm8 | |
vpaddd ymm8, ymm8, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_44] ## ymm10 = [3345764771,3345764771,3345764771,3345764771,3345764771,3345764771,3345764771,3345764771] | |
vpaddd ymm8, ymm8, ymm10 | |
vpaddd ymm9, ymm9, ymm8 | |
vpsrld ymm8, ymm3, 2 | |
vpslld ymm10, ymm3, 30 | |
vpor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm3, 13 | |
vpslld ymm11, ymm3, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm3, 22 | |
vpslld ymm11, ymm3, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm8, ymm10 | |
vpand ymm8, ymm3, ymm2 | |
vpxor ymm5, ymm8, ymm5 | |
vpand ymm11, ymm3, ymm4 | |
vpxor ymm5, ymm5, ymm11 | |
vpaddd ymm5, ymm10, ymm5 | |
vpaddd ymm6, ymm9, ymm6 | |
vpaddd ymm5, ymm5, ymm9 | |
vmovdqa ymmword ptr [rsp + 128], ymm15 ## 32-byte Spill | |
vpsrld ymm9, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 544] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vmovdqa ymm15, ymm13 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 416] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm10, ymm9 | |
vpsrld ymm9, ymm6, 6 | |
vpslld ymm10, ymm6, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm6, 11 | |
vpslld ymm11, ymm6, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm6, 25 | |
vpslld ymm11, ymm6, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm6, ymm7 | |
vpandn ymm11, ymm6, ymm1 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm0, ymm13, ymm0 | |
vpaddd ymm0, ymm0, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_45] ## ymm10 = [3516065817,3516065817,3516065817,3516065817,3516065817,3516065817,3516065817,3516065817] | |
vpaddd ymm0, ymm0, ymm10 | |
vpaddd ymm9, ymm9, ymm0 | |
vpsrld ymm0, ymm5, 2 | |
vpslld ymm10, ymm5, 30 | |
vpor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm5, 13 | |
vpslld ymm11, ymm5, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm5, 22 | |
vpslld ymm11, ymm5, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm0, ymm10 | |
vpand ymm0, ymm5, ymm3 | |
vpxor ymm8, ymm0, ymm8 | |
vpand ymm11, ymm5, ymm2 | |
vpxor ymm8, ymm8, ymm11 | |
vpaddd ymm10, ymm10, ymm8 | |
vpaddd ymm8, ymm9, ymm4 | |
vpaddd ymm4, ymm10, ymm9 | |
vmovdqa ymmword ptr [rsp + 384], ymm14 ## 32-byte Spill | |
vpsrld ymm9, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp + 320] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm15 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 352] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm9 | |
vpsrld ymm9, ymm8, 6 | |
vpslld ymm10, ymm8, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm8, 11 | |
vpslld ymm11, ymm8, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm8, 25 | |
vpslld ymm11, ymm8, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm8, ymm6 | |
vpandn ymm11, ymm8, ymm7 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm1, ymm15, ymm1 | |
vpaddd ymm1, ymm1, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_46] ## ymm10 = [3600352804,3600352804,3600352804,3600352804,3600352804,3600352804,3600352804,3600352804] | |
vpaddd ymm1, ymm1, ymm10 | |
vpaddd ymm9, ymm9, ymm1 | |
vpsrld ymm1, ymm4, 2 | |
vpslld ymm10, ymm4, 30 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm4, 13 | |
vpslld ymm11, ymm4, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm4, 22 | |
vpslld ymm11, ymm4, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm1, ymm10 | |
vpand ymm1, ymm4, ymm5 | |
vpxor ymm0, ymm1, ymm0 | |
vpand ymm11, ymm4, ymm3 | |
vpxor ymm0, ymm0, ymm11 | |
vpaddd ymm0, ymm10, ymm0 | |
vpaddd ymm10, ymm9, ymm2 | |
vpaddd ymm2, ymm0, ymm9 | |
vmovdqa ymmword ptr [rsp + 448], ymm13 ## 32-byte Spill | |
vpsrld ymm0, ymm13, 17 | |
vpslld ymm9, ymm13, 15 | |
vpor ymm0, ymm9, ymm0 | |
vpsrld ymm9, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm0, ymm0, ymm11 | |
vpxor ymm0, ymm0, ymm9 | |
vmovdqa ymm13, ymmword ptr [rsp + 160] ## 32-byte Reload | |
vpsrld ymm9, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm9, ymm14 | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 64] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm9, ymm0 | |
vpsrld ymm0, ymm10, 6 | |
vpslld ymm9, ymm10, 26 | |
vpor ymm0, ymm9, ymm0 | |
vpsrld ymm9, ymm10, 11 | |
vpslld ymm11, ymm10, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm0, ymm9, ymm0 | |
vpsrld ymm9, ymm10, 25 | |
vpslld ymm11, ymm10, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm0, ymm0, ymm9 | |
vpand ymm9, ymm10, ymm8 | |
vpandn ymm11, ymm10, ymm6 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm7, ymm13, ymm7 | |
vpaddd ymm7, ymm7, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_47] ## ymm9 = [4094571909,4094571909,4094571909,4094571909,4094571909,4094571909,4094571909,4094571909] | |
vpaddd ymm7, ymm7, ymm9 | |
vpaddd ymm9, ymm0, ymm7 | |
vpsrld ymm0, ymm2, 2 | |
vpslld ymm7, ymm2, 30 | |
vpor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm2, 13 | |
vpslld ymm11, ymm2, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm0, ymm7, ymm0 | |
vpsrld ymm7, ymm2, 22 | |
vpslld ymm11, ymm2, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm7, ymm0, ymm7 | |
vpand ymm0, ymm2, ymm4 | |
vpxor ymm1, ymm0, ymm1 | |
vpand ymm11, ymm2, ymm5 | |
vpxor ymm1, ymm1, ymm11 | |
vpaddd ymm1, ymm7, ymm1 | |
vpaddd ymm7, ymm9, ymm3 | |
vpaddd ymm3, ymm1, ymm9 | |
vmovdqa ymmword ptr [rsp + 512], ymm15 ## 32-byte Spill | |
vpsrld ymm1, ymm15, 17 | |
vpslld ymm9, ymm15, 15 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm1, ymm1, ymm11 | |
vpxor ymm1, ymm1, ymm9 | |
vmovdqa ymm14, ymmword ptr [rsp + 192] ## 32-byte Reload | |
vpsrld ymm9, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm9, ymm11, ymm9 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vmovdqa ymm15, ymm14 | |
vpxor ymm9, ymm9, ymm12 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm9, ymm9, ymmword ptr [rsp + 160] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm9, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm9, ymm1 | |
vpsrld ymm1, ymm7, 6 | |
vpslld ymm9, ymm7, 26 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm7, 11 | |
vpslld ymm11, ymm7, 21 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm7, 25 | |
vpslld ymm11, ymm7, 7 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm1, ymm9 | |
vpand ymm9, ymm7, ymm10 | |
vpandn ymm11, ymm7, ymm8 | |
vpxor ymm9, ymm9, ymm11 | |
vpaddd ymm6, ymm14, ymm6 | |
vpaddd ymm6, ymm6, ymm9 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_48] ## ymm9 = [275423344,275423344,275423344,275423344,275423344,275423344,275423344,275423344] | |
vpaddd ymm6, ymm6, ymm9 | |
vpaddd ymm6, ymm1, ymm6 | |
vpsrld ymm1, ymm3, 2 | |
vpslld ymm9, ymm3, 30 | |
vpor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm3, 13 | |
vpslld ymm11, ymm3, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm1, ymm9, ymm1 | |
vpsrld ymm9, ymm3, 22 | |
vpslld ymm11, ymm3, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm9, ymm1, ymm9 | |
vpand ymm1, ymm3, ymm2 | |
vpxor ymm0, ymm1, ymm0 | |
vpand ymm11, ymm3, ymm4 | |
vpxor ymm0, ymm0, ymm11 | |
vpaddd ymm0, ymm9, ymm0 | |
vpaddd ymm5, ymm6, ymm5 | |
vpaddd ymm9, ymm0, ymm6 | |
vmovdqa ymmword ptr [rsp + 32], ymm13 ## 32-byte Spill | |
vpsrld ymm0, ymm13, 17 | |
vpslld ymm6, ymm13, 15 | |
vpor ymm0, ymm6, ymm0 | |
vpsrld ymm6, ymm13, 19 | |
vpslld ymm11, ymm13, 13 | |
vpor ymm6, ymm11, ymm6 | |
vpsrld ymm11, ymm13, 10 | |
vpxor ymm0, ymm0, ymm11 | |
vpxor ymm0, ymm0, ymm6 | |
vmovdqa ymm13, ymmword ptr [rsp + 288] ## 32-byte Reload | |
vpsrld ymm6, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm6, ymm11, ymm6 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm6, ymm6, ymm12 | |
vpxor ymm6, ymm6, ymm11 | |
vpaddd ymm6, ymm6, ymm15 | |
vpaddd ymm6, ymm6, ymmword ptr [rsp + 480] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm6, ymm0 | |
vpsrld ymm0, ymm5, 6 | |
vpslld ymm6, ymm5, 26 | |
vpor ymm0, ymm6, ymm0 | |
vpsrld ymm6, ymm5, 11 | |
vpslld ymm11, ymm5, 21 | |
vpor ymm6, ymm11, ymm6 | |
vpxor ymm0, ymm6, ymm0 | |
vpsrld ymm6, ymm5, 25 | |
vpslld ymm11, ymm5, 7 | |
vpor ymm6, ymm11, ymm6 | |
vpxor ymm0, ymm0, ymm6 | |
vpand ymm6, ymm5, ymm7 | |
vpandn ymm11, ymm5, ymm10 | |
vpxor ymm6, ymm6, ymm11 | |
vpaddd ymm8, ymm15, ymm8 | |
vpaddd ymm6, ymm8, ymm6 | |
vpbroadcastd ymm8, dword ptr [rip + LCPI2_49] ## ymm8 = [430227734,430227734,430227734,430227734,430227734,430227734,430227734,430227734] | |
vpaddd ymm6, ymm6, ymm8 | |
vpaddd ymm8, ymm0, ymm6 | |
vpsrld ymm0, ymm9, 2 | |
vpslld ymm6, ymm9, 30 | |
vpor ymm0, ymm6, ymm0 | |
vpsrld ymm6, ymm9, 13 | |
vpslld ymm11, ymm9, 19 | |
vpor ymm6, ymm11, ymm6 | |
vpxor ymm0, ymm6, ymm0 | |
vpsrld ymm6, ymm9, 22 | |
vpslld ymm11, ymm9, 10 | |
vpor ymm6, ymm11, ymm6 | |
vpxor ymm6, ymm0, ymm6 | |
vpand ymm0, ymm9, ymm3 | |
vpxor ymm1, ymm0, ymm1 | |
vpand ymm11, ymm9, ymm2 | |
vpxor ymm1, ymm1, ymm11 | |
vpaddd ymm1, ymm6, ymm1 | |
vpaddd ymm6, ymm8, ymm4 | |
vpaddd ymm4, ymm1, ymm8 | |
vmovdqa ymmword ptr [rsp + 160], ymm14 ## 32-byte Spill | |
vpsrld ymm1, ymm14, 17 | |
vpslld ymm8, ymm14, 15 | |
vpor ymm1, ymm8, ymm1 | |
vpsrld ymm8, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm8, ymm11, ymm8 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm1, ymm1, ymm11 | |
vpxor ymm1, ymm1, ymm8 | |
vmovdqa ymm14, ymmword ptr [rsp + 96] ## 32-byte Reload | |
vpsrld ymm8, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm8, ymm11, ymm8 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm8, ymm8, ymm12 | |
vpxor ymm8, ymm8, ymm11 | |
vpaddd ymm8, ymm8, ymm13 | |
vpaddd ymm8, ymm8, ymmword ptr [rsp + 128] ## 32-byte Folded Reload | |
vpaddd ymm13, ymm8, ymm1 | |
vpsrld ymm1, ymm6, 6 | |
vpslld ymm8, ymm6, 26 | |
vpor ymm1, ymm8, ymm1 | |
vpsrld ymm8, ymm6, 11 | |
vpslld ymm11, ymm6, 21 | |
vpor ymm8, ymm11, ymm8 | |
vpxor ymm1, ymm8, ymm1 | |
vpsrld ymm8, ymm6, 25 | |
vpslld ymm11, ymm6, 7 | |
vpor ymm8, ymm11, ymm8 | |
vpxor ymm1, ymm1, ymm8 | |
vpand ymm8, ymm6, ymm5 | |
vpandn ymm11, ymm6, ymm7 | |
vpxor ymm8, ymm8, ymm11 | |
vpaddd ymm10, ymm13, ymm10 | |
vpaddd ymm8, ymm10, ymm8 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_50] ## ymm10 = [506948616,506948616,506948616,506948616,506948616,506948616,506948616,506948616] | |
vpaddd ymm8, ymm8, ymm10 | |
vpaddd ymm8, ymm1, ymm8 | |
vpsrld ymm1, ymm4, 2 | |
vpslld ymm10, ymm4, 30 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm4, 13 | |
vpslld ymm11, ymm4, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm4, 22 | |
vpslld ymm11, ymm4, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm1, ymm10 | |
vpand ymm1, ymm4, ymm9 | |
vpxor ymm0, ymm1, ymm0 | |
vpand ymm11, ymm4, ymm3 | |
vpxor ymm0, ymm0, ymm11 | |
vpaddd ymm10, ymm10, ymm0 | |
vpaddd ymm0, ymm8, ymm2 | |
vpaddd ymm8, ymm10, ymm8 | |
vmovdqa ymmword ptr [rsp + 320], ymm15 ## 32-byte Spill | |
vpsrld ymm2, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm2, ymm2, ymm11 | |
vpxor ymm2, ymm2, ymm10 | |
vmovdqa ymm15, ymmword ptr [rsp + 256] ## 32-byte Reload | |
vpsrld ymm10, ymm15, 7 | |
vpslld ymm11, ymm15, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 18 | |
vpslld ymm12, ymm15, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm15, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 384] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm2 | |
vpsrld ymm2, ymm0, 6 | |
vpslld ymm10, ymm0, 26 | |
vpor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm0, 11 | |
vpslld ymm12, ymm0, 21 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm2, ymm10, ymm2 | |
vpsrld ymm10, ymm0, 25 | |
vpslld ymm12, ymm0, 7 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm2, ymm2, ymm10 | |
vpand ymm10, ymm0, ymm6 | |
vpandn ymm12, ymm0, ymm5 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm7, ymm15, ymm7 | |
vpaddd ymm7, ymm7, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_51] ## ymm10 = [659060556,659060556,659060556,659060556,659060556,659060556,659060556,659060556] | |
vpaddd ymm7, ymm7, ymm10 | |
vpaddd ymm10, ymm2, ymm7 | |
vpsrld ymm2, ymm8, 2 | |
vpslld ymm7, ymm8, 30 | |
vpor ymm2, ymm7, ymm2 | |
vpsrld ymm7, ymm8, 13 | |
vpslld ymm12, ymm8, 19 | |
vpor ymm7, ymm12, ymm7 | |
vpxor ymm2, ymm7, ymm2 | |
vpsrld ymm7, ymm8, 22 | |
vpslld ymm12, ymm8, 10 | |
vpor ymm7, ymm12, ymm7 | |
vpxor ymm7, ymm2, ymm7 | |
vpand ymm2, ymm8, ymm4 | |
vpxor ymm1, ymm2, ymm1 | |
vpand ymm12, ymm8, ymm9 | |
vpxor ymm1, ymm1, ymm12 | |
vpaddd ymm1, ymm7, ymm1 | |
vpaddd ymm7, ymm10, ymm3 | |
vpaddd ymm3, ymm1, ymm10 | |
vmovdqa ymmword ptr [rsp + 192], ymm13 ## 32-byte Spill | |
vpsrld ymm1, ymm13, 17 | |
vpslld ymm10, ymm13, 15 | |
vpor ymm1, ymm10, ymm1 | |
vpsrld ymm10, ymm13, 19 | |
vpslld ymm12, ymm13, 13 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm13, 10 | |
vpxor ymm1, ymm1, ymm12 | |
vpxor ymm1, ymm1, ymm10 | |
vmovdqa ymm11, ymmword ptr [rsp + 224] ## 32-byte Reload | |
vpsrld ymm10, ymm11, 7 | |
vpslld ymm12, ymm11, 25 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm11, 18 | |
vpslld ymm14, ymm11, 14 | |
vpor ymm12, ymm14, ymm12 | |
vpsrld ymm14, ymm11, 3 | |
vpxor ymm10, ymm10, ymm14 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 256] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 448] ## 32-byte Folded Reload | |
vpaddd ymm11, ymm10, ymm1 | |
vpsrld ymm1, ymm7, 6 | |
vpslld ymm12, ymm7, 26 | |
vpor ymm1, ymm12, ymm1 | |
vpsrld ymm12, ymm7, 11 | |
vpslld ymm14, ymm7, 21 | |
vpor ymm12, ymm14, ymm12 | |
vpxor ymm1, ymm12, ymm1 | |
vpsrld ymm12, ymm7, 25 | |
vpslld ymm14, ymm7, 7 | |
vpor ymm12, ymm14, ymm12 | |
vpxor ymm1, ymm1, ymm12 | |
vpand ymm12, ymm7, ymm0 | |
vpandn ymm14, ymm7, ymm6 | |
vpxor ymm12, ymm12, ymm14 | |
vpaddd ymm5, ymm11, ymm5 | |
vpaddd ymm5, ymm5, ymm12 | |
vpbroadcastd ymm12, dword ptr [rip + LCPI2_52] ## ymm12 = [883997877,883997877,883997877,883997877,883997877,883997877,883997877,883997877] | |
vpaddd ymm5, ymm5, ymm12 | |
vpaddd ymm12, ymm1, ymm5 | |
vpsrld ymm1, ymm3, 2 | |
vpslld ymm5, ymm3, 30 | |
vpor ymm1, ymm5, ymm1 | |
vpsrld ymm5, ymm3, 13 | |
vpslld ymm14, ymm3, 19 | |
vpor ymm5, ymm14, ymm5 | |
vpxor ymm1, ymm5, ymm1 | |
vpsrld ymm5, ymm3, 22 | |
vpslld ymm14, ymm3, 10 | |
vpor ymm5, ymm14, ymm5 | |
vpxor ymm1, ymm1, ymm5 | |
vpand ymm5, ymm3, ymm8 | |
vpxor ymm2, ymm5, ymm2 | |
vpand ymm14, ymm3, ymm4 | |
vpxor ymm2, ymm2, ymm14 | |
vpaddd ymm2, ymm1, ymm2 | |
vpaddd ymm1, ymm12, ymm9 | |
vpaddd ymm9, ymm2, ymm12 | |
vmovdqa ymmword ptr [rsp + 96], ymm15 ## 32-byte Spill | |
vpsrld ymm2, ymm15, 17 | |
vpslld ymm12, ymm15, 15 | |
vpor ymm2, ymm12, ymm2 | |
vpsrld ymm12, ymm15, 19 | |
vpslld ymm14, ymm15, 13 | |
vpor ymm12, ymm14, ymm12 | |
vpsrld ymm14, ymm15, 10 | |
vpxor ymm2, ymm2, ymm14 | |
vpxor ymm2, ymm2, ymm12 | |
vmovdqa ymm10, ymmword ptr [rsp + 416] ## 32-byte Reload | |
vpsrld ymm12, ymm10, 7 | |
vpslld ymm14, ymm10, 25 | |
vpor ymm12, ymm14, ymm12 | |
vpsrld ymm14, ymm10, 18 | |
vpslld ymm15, ymm10, 14 | |
vpor ymm14, ymm15, ymm14 | |
vpsrld ymm15, ymm10, 3 | |
vmovdqa ymm13, ymm10 | |
vpxor ymm12, ymm12, ymm15 | |
vpxor ymm12, ymm12, ymm14 | |
vpaddd ymm12, ymm12, ymmword ptr [rsp + 224] ## 32-byte Folded Reload | |
vpaddd ymm12, ymm12, ymmword ptr [rsp + 512] ## 32-byte Folded Reload | |
vpaddd ymm12, ymm12, ymm2 | |
vpsrld ymm2, ymm1, 6 | |
vpslld ymm14, ymm1, 26 | |
vpor ymm2, ymm14, ymm2 | |
vpsrld ymm14, ymm1, 11 | |
vpslld ymm15, ymm1, 21 | |
vpor ymm14, ymm15, ymm14 | |
vpxor ymm2, ymm14, ymm2 | |
vpsrld ymm14, ymm1, 25 | |
vpslld ymm15, ymm1, 7 | |
vpor ymm14, ymm15, ymm14 | |
vpxor ymm2, ymm2, ymm14 | |
vpand ymm14, ymm1, ymm7 | |
vpandn ymm15, ymm1, ymm0 | |
vpxor ymm14, ymm14, ymm15 | |
vpaddd ymm6, ymm12, ymm6 | |
vpaddd ymm6, ymm6, ymm14 | |
vpbroadcastd ymm14, dword ptr [rip + LCPI2_53] ## ymm14 = [958139571,958139571,958139571,958139571,958139571,958139571,958139571,958139571] | |
vpaddd ymm6, ymm6, ymm14 | |
vpaddd ymm14, ymm2, ymm6 | |
vpsrld ymm2, ymm9, 2 | |
vpslld ymm6, ymm9, 30 | |
vpor ymm2, ymm6, ymm2 | |
vpsrld ymm6, ymm9, 13 | |
vpslld ymm15, ymm9, 19 | |
vpor ymm6, ymm15, ymm6 | |
vpxor ymm2, ymm6, ymm2 | |
vpsrld ymm6, ymm9, 22 | |
vpslld ymm15, ymm9, 10 | |
vpor ymm6, ymm15, ymm6 | |
vpxor ymm2, ymm2, ymm6 | |
vpand ymm6, ymm9, ymm3 | |
vpxor ymm5, ymm6, ymm5 | |
vpand ymm15, ymm9, ymm8 | |
vpxor ymm5, ymm5, ymm15 | |
vpaddd ymm5, ymm2, ymm5 | |
vpaddd ymm2, ymm14, ymm4 | |
vpaddd ymm4, ymm5, ymm14 | |
vmovdqa ymmword ptr [rsp + 256], ymm11 ## 32-byte Spill | |
vpsrld ymm5, ymm11, 17 | |
vpslld ymm14, ymm11, 15 | |
vpor ymm5, ymm14, ymm5 | |
vpsrld ymm14, ymm11, 19 | |
vpslld ymm15, ymm11, 13 | |
vpor ymm14, ymm15, ymm14 | |
vpsrld ymm15, ymm11, 10 | |
vpxor ymm5, ymm5, ymm15 | |
vpxor ymm5, ymm5, ymm14 | |
vmovdqa ymm11, ymmword ptr [rsp + 352] ## 32-byte Reload | |
vpsrld ymm14, ymm11, 7 | |
vpslld ymm15, ymm11, 25 | |
vpor ymm14, ymm15, ymm14 | |
vpsrld ymm15, ymm11, 18 | |
vpslld ymm10, ymm11, 14 | |
vpor ymm10, ymm10, ymm15 | |
vpsrld ymm15, ymm11, 3 | |
vpxor ymm14, ymm14, ymm15 | |
vpxor ymm10, ymm14, ymm10 | |
vpaddd ymm10, ymm10, ymm13 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm5 | |
vpsrld ymm5, ymm2, 6 | |
vpslld ymm10, ymm2, 26 | |
vpor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm2, 11 | |
vpslld ymm15, ymm2, 21 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm5, ymm10, ymm5 | |
vpsrld ymm10, ymm2, 25 | |
vpslld ymm15, ymm2, 7 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm5, ymm5, ymm10 | |
vpand ymm10, ymm2, ymm1 | |
vpandn ymm15, ymm2, ymm7 | |
vpxor ymm10, ymm10, ymm15 | |
vpaddd ymm0, ymm14, ymm0 | |
vpaddd ymm0, ymm0, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_54] ## ymm10 = [1322822218,1322822218,1322822218,1322822218,1322822218,1322822218,1322822218,1322822218] | |
vpaddd ymm0, ymm0, ymm10 | |
vpaddd ymm5, ymm5, ymm0 | |
vpsrld ymm0, ymm4, 2 | |
vpslld ymm10, ymm4, 30 | |
vpor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm4, 13 | |
vpslld ymm15, ymm4, 19 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm0, ymm10, ymm0 | |
vpsrld ymm10, ymm4, 22 | |
vpslld ymm15, ymm4, 10 | |
vpor ymm10, ymm15, ymm10 | |
vpxor ymm10, ymm0, ymm10 | |
vpand ymm0, ymm4, ymm9 | |
vpxor ymm6, ymm0, ymm6 | |
vpand ymm15, ymm4, ymm3 | |
vpxor ymm6, ymm6, ymm15 | |
vpaddd ymm6, ymm10, ymm6 | |
vpaddd ymm8, ymm5, ymm8 | |
vpaddd ymm5, ymm6, ymm5 | |
vmovdqa ymmword ptr [rsp + 224], ymm12 ## 32-byte Spill | |
vpsrld ymm6, ymm12, 17 | |
vpslld ymm10, ymm12, 15 | |
vpor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm12, 19 | |
vpslld ymm15, ymm12, 13 | |
vpor ymm10, ymm15, ymm10 | |
vpsrld ymm15, ymm12, 10 | |
vpxor ymm6, ymm6, ymm15 | |
vpxor ymm6, ymm6, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 64] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm15, ymm13, 25 | |
vpor ymm10, ymm15, ymm10 | |
vpsrld ymm15, ymm13, 18 | |
vpslld ymm11, ymm13, 14 | |
vpor ymm11, ymm11, ymm15 | |
vpsrld ymm15, ymm13, 3 | |
vpxor ymm10, ymm10, ymm15 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 352] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 160] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm6 | |
vpsrld ymm6, ymm8, 6 | |
vpslld ymm10, ymm8, 26 | |
vpor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm8, 11 | |
vpslld ymm11, ymm8, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm8, 25 | |
vpslld ymm11, ymm8, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm6, ymm6, ymm10 | |
vpand ymm10, ymm8, ymm2 | |
vpandn ymm11, ymm8, ymm1 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm7, ymm15, ymm7 | |
vpaddd ymm7, ymm7, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_55] ## ymm10 = [1537002063,1537002063,1537002063,1537002063,1537002063,1537002063,1537002063,1537002063] | |
vpaddd ymm7, ymm7, ymm10 | |
vpaddd ymm7, ymm6, ymm7 | |
vpsrld ymm6, ymm5, 2 | |
vpslld ymm10, ymm5, 30 | |
vpor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm5, 13 | |
vpslld ymm11, ymm5, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm6, ymm10, ymm6 | |
vpsrld ymm10, ymm5, 22 | |
vpslld ymm11, ymm5, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm10, ymm6, ymm10 | |
vpand ymm6, ymm5, ymm4 | |
vpxor ymm0, ymm6, ymm0 | |
vpand ymm11, ymm5, ymm9 | |
vpxor ymm0, ymm0, ymm11 | |
vpaddd ymm10, ymm10, ymm0 | |
vpaddd ymm0, ymm7, ymm3 | |
vpaddd ymm3, ymm10, ymm7 | |
vmovdqa ymmword ptr [rsp + 288], ymm14 ## 32-byte Spill | |
vpsrld ymm7, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm13 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 320] ## 32-byte Folded Reload | |
vpaddd ymm14, ymm10, ymm7 | |
vpsrld ymm7, ymm0, 6 | |
vpslld ymm10, ymm0, 26 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm0, 11 | |
vpslld ymm11, ymm0, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm0, 25 | |
vpslld ymm11, ymm0, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm7, ymm7, ymm10 | |
vpand ymm10, ymm0, ymm8 | |
vpandn ymm11, ymm0, ymm2 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm1, ymm14, ymm1 | |
vpaddd ymm1, ymm1, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_56] ## ymm10 = [1747873779,1747873779,1747873779,1747873779,1747873779,1747873779,1747873779,1747873779] | |
vpaddd ymm1, ymm1, ymm10 | |
vpaddd ymm10, ymm7, ymm1 | |
vpsrld ymm1, ymm3, 2 | |
vpslld ymm7, ymm3, 30 | |
vpor ymm1, ymm7, ymm1 | |
vpsrld ymm7, ymm3, 13 | |
vpslld ymm11, ymm3, 19 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm1, ymm7, ymm1 | |
vpsrld ymm7, ymm3, 22 | |
vpslld ymm11, ymm3, 10 | |
vpor ymm7, ymm11, ymm7 | |
vpxor ymm1, ymm1, ymm7 | |
vpand ymm7, ymm3, ymm5 | |
vpxor ymm6, ymm7, ymm6 | |
vpand ymm11, ymm3, ymm4 | |
vpxor ymm6, ymm6, ymm11 | |
vpaddd ymm6, ymm1, ymm6 | |
vpaddd ymm1, ymm10, ymm9 | |
vpaddd ymm6, ymm6, ymm10 | |
vmovdqa ymmword ptr [rsp + 352], ymm15 ## 32-byte Spill | |
vpsrld ymm9, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm11, ymm15, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm15, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 480] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 192] ## 32-byte Folded Reload | |
vpaddd ymm15, ymm10, ymm9 | |
vpsrld ymm9, ymm1, 6 | |
vpslld ymm10, ymm1, 26 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm1, 11 | |
vpslld ymm11, ymm1, 21 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm1, 25 | |
vpslld ymm11, ymm1, 7 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpand ymm10, ymm1, ymm0 | |
vpandn ymm11, ymm1, ymm8 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm2, ymm15, ymm2 | |
vpaddd ymm2, ymm2, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_57] ## ymm10 = [1955562222,1955562222,1955562222,1955562222,1955562222,1955562222,1955562222,1955562222] | |
vpaddd ymm2, ymm2, ymm10 | |
vpaddd ymm10, ymm9, ymm2 | |
vpsrld ymm2, ymm6, 2 | |
vpslld ymm9, ymm6, 30 | |
vpor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm6, 13 | |
vpslld ymm11, ymm6, 19 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm2, ymm9, ymm2 | |
vpsrld ymm9, ymm6, 22 | |
vpslld ymm11, ymm6, 10 | |
vpor ymm9, ymm11, ymm9 | |
vpxor ymm2, ymm2, ymm9 | |
vpand ymm9, ymm6, ymm3 | |
vpxor ymm7, ymm9, ymm7 | |
vpand ymm11, ymm6, ymm5 | |
vpxor ymm7, ymm7, ymm11 | |
vpaddd ymm7, ymm2, ymm7 | |
vpaddd ymm2, ymm10, ymm4 | |
vpaddd ymm4, ymm7, ymm10 | |
vmovdqa ymmword ptr [rsp + 64], ymm14 ## 32-byte Spill | |
vpsrld ymm7, ymm14, 17 | |
vpslld ymm10, ymm14, 15 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm14, 19 | |
vpslld ymm11, ymm14, 13 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm10 | |
vmovdqa ymm14, ymmword ptr [rsp + 128] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm11, ymm14, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm14, 18 | |
vpslld ymm12, ymm14, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 480] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 96] ## 32-byte Folded Reload | |
vpaddd ymm11, ymm10, ymm7 | |
vpsrld ymm7, ymm2, 6 | |
vpslld ymm10, ymm2, 26 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm2, 11 | |
vpslld ymm12, ymm2, 21 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm2, 25 | |
vpslld ymm12, ymm2, 7 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm7, ymm7, ymm10 | |
vpand ymm10, ymm2, ymm1 | |
vpandn ymm12, ymm2, ymm0 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm8, ymm11, ymm8 | |
vpaddd ymm8, ymm8, ymm10 | |
vpbroadcastd ymm10, dword ptr [rip + LCPI2_58] ## ymm10 = [2024104815,2024104815,2024104815,2024104815,2024104815,2024104815,2024104815,2024104815] | |
vpaddd ymm8, ymm8, ymm10 | |
vpaddd ymm8, ymm7, ymm8 | |
vpsrld ymm7, ymm4, 2 | |
vpslld ymm10, ymm4, 30 | |
vpor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm4, 13 | |
vpslld ymm12, ymm4, 19 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm7, ymm10, ymm7 | |
vpsrld ymm10, ymm4, 22 | |
vpslld ymm12, ymm4, 10 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm10, ymm7, ymm10 | |
vpand ymm7, ymm4, ymm6 | |
vpxor ymm9, ymm7, ymm9 | |
vpand ymm12, ymm4, ymm3 | |
vpxor ymm9, ymm9, ymm12 | |
vpaddd ymm9, ymm10, ymm9 | |
vpaddd ymm5, ymm8, ymm5 | |
vpaddd ymm9, ymm9, ymm8 | |
vmovdqa ymmword ptr [rsp], ymm15 ## 32-byte Spill | |
vpsrld ymm8, ymm15, 17 | |
vpslld ymm10, ymm15, 15 | |
vpor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm15, 19 | |
vpslld ymm12, ymm15, 13 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm15, 10 | |
vpxor ymm8, ymm8, ymm12 | |
vpxor ymm8, ymm8, ymm10 | |
vmovdqa ymm15, ymmword ptr [rsp + 384] ## 32-byte Reload | |
vpsrld ymm10, ymm15, 7 | |
vpslld ymm12, ymm15, 25 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm15, 18 | |
vpslld ymm13, ymm15, 14 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm13, ymm15, 3 | |
vpxor ymm10, ymm10, ymm13 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 256] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymm8 | |
vpsrld ymm8, ymm5, 6 | |
vpslld ymm12, ymm5, 26 | |
vpor ymm8, ymm12, ymm8 | |
vpsrld ymm12, ymm5, 11 | |
vpslld ymm13, ymm5, 21 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm8, ymm12, ymm8 | |
vpsrld ymm12, ymm5, 25 | |
vpslld ymm13, ymm5, 7 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm8, ymm8, ymm12 | |
vpand ymm12, ymm5, ymm2 | |
vpandn ymm13, ymm5, ymm1 | |
vpxor ymm12, ymm12, ymm13 | |
vpaddd ymm0, ymm10, ymm0 | |
vpaddd ymm0, ymm0, ymm12 | |
vpbroadcastd ymm12, dword ptr [rip + LCPI2_59] ## ymm12 = [2227730452,2227730452,2227730452,2227730452,2227730452,2227730452,2227730452,2227730452] | |
vpaddd ymm0, ymm0, ymm12 | |
vpaddd ymm12, ymm8, ymm0 | |
vpsrld ymm0, ymm9, 2 | |
vpslld ymm8, ymm9, 30 | |
vpor ymm0, ymm8, ymm0 | |
vpsrld ymm8, ymm9, 13 | |
vpslld ymm13, ymm9, 19 | |
vpor ymm8, ymm13, ymm8 | |
vpxor ymm0, ymm8, ymm0 | |
vpsrld ymm8, ymm9, 22 | |
vpslld ymm13, ymm9, 10 | |
vpor ymm8, ymm13, ymm8 | |
vpxor ymm8, ymm0, ymm8 | |
vpand ymm0, ymm9, ymm4 | |
vpxor ymm7, ymm0, ymm7 | |
vpand ymm13, ymm9, ymm6 | |
vpxor ymm7, ymm7, ymm13 | |
vpaddd ymm7, ymm8, ymm7 | |
vpaddd ymm8, ymm12, ymm3 | |
vpaddd ymm3, ymm7, ymm12 | |
vpsrld ymm7, ymm11, 17 | |
vpslld ymm12, ymm11, 15 | |
vpor ymm7, ymm12, ymm7 | |
vpsrld ymm12, ymm11, 19 | |
vpslld ymm13, ymm11, 13 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm11, ymm11, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm12 | |
vmovdqa ymm14, ymmword ptr [rsp + 448] ## 32-byte Reload | |
vpsrld ymm11, ymm14, 7 | |
vpslld ymm12, ymm14, 25 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 18 | |
vpslld ymm13, ymm14, 14 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm13, ymm14, 3 | |
vpxor ymm11, ymm11, ymm13 | |
vpxor ymm11, ymm11, ymm12 | |
vpaddd ymm11, ymm11, ymm15 | |
vpaddd ymm11, ymm11, ymmword ptr [rsp + 224] ## 32-byte Folded Reload | |
vpaddd ymm11, ymm11, ymm7 | |
vpsrld ymm7, ymm8, 6 | |
vpslld ymm12, ymm8, 26 | |
vpor ymm7, ymm12, ymm7 | |
vpsrld ymm12, ymm8, 11 | |
vpslld ymm13, ymm8, 21 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm7, ymm12, ymm7 | |
vpsrld ymm12, ymm8, 25 | |
vpslld ymm13, ymm8, 7 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm7, ymm7, ymm12 | |
vpand ymm12, ymm8, ymm5 | |
vpandn ymm13, ymm8, ymm2 | |
vpxor ymm12, ymm12, ymm13 | |
vpaddd ymm1, ymm11, ymm1 | |
vpaddd ymm1, ymm1, ymm12 | |
vpbroadcastd ymm12, dword ptr [rip + LCPI2_60] ## ymm12 = [2361852424,2361852424,2361852424,2361852424,2361852424,2361852424,2361852424,2361852424] | |
vpaddd ymm1, ymm1, ymm12 | |
vpaddd ymm12, ymm7, ymm1 | |
vpsrld ymm1, ymm3, 2 | |
vpslld ymm7, ymm3, 30 | |
vpor ymm1, ymm7, ymm1 | |
vpsrld ymm7, ymm3, 13 | |
vpslld ymm13, ymm3, 19 | |
vpor ymm7, ymm13, ymm7 | |
vpxor ymm1, ymm7, ymm1 | |
vpsrld ymm7, ymm3, 22 | |
vpslld ymm13, ymm3, 10 | |
vpor ymm7, ymm13, ymm7 | |
vpxor ymm1, ymm1, ymm7 | |
vpand ymm7, ymm3, ymm9 | |
vpxor ymm0, ymm7, ymm0 | |
vpand ymm13, ymm3, ymm4 | |
vpxor ymm0, ymm0, ymm13 | |
vpaddd ymm0, ymm1, ymm0 | |
vpaddd ymm1, ymm12, ymm6 | |
vpaddd ymm0, ymm0, ymm12 | |
vpsrld ymm6, ymm10, 17 | |
vpslld ymm12, ymm10, 15 | |
vpor ymm6, ymm12, ymm6 | |
vpsrld ymm12, ymm10, 19 | |
vpslld ymm13, ymm10, 13 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm10, ymm10, 10 | |
vpxor ymm6, ymm6, ymm10 | |
vpxor ymm6, ymm6, ymm12 | |
vmovdqa ymm15, ymmword ptr [rsp + 512] ## 32-byte Reload | |
vpsrld ymm10, ymm15, 7 | |
vpslld ymm12, ymm15, 25 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm15, 18 | |
vpslld ymm13, ymm15, 14 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm13, ymm15, 3 | |
vpxor ymm10, ymm10, ymm13 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 288] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymm6 | |
vpsrld ymm6, ymm1, 6 | |
vpslld ymm12, ymm1, 26 | |
vpor ymm6, ymm12, ymm6 | |
vpsrld ymm12, ymm1, 11 | |
vpslld ymm13, ymm1, 21 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm6, ymm12, ymm6 | |
vpsrld ymm12, ymm1, 25 | |
vpslld ymm13, ymm1, 7 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm6, ymm6, ymm12 | |
vpand ymm12, ymm1, ymm8 | |
vpandn ymm13, ymm1, ymm5 | |
vpxor ymm12, ymm12, ymm13 | |
vpaddd ymm2, ymm10, ymm2 | |
vpaddd ymm2, ymm2, ymm12 | |
vpbroadcastd ymm12, dword ptr [rip + LCPI2_61] ## ymm12 = [2428436474,2428436474,2428436474,2428436474,2428436474,2428436474,2428436474,2428436474] | |
vpaddd ymm2, ymm2, ymm12 | |
vpaddd ymm12, ymm6, ymm2 | |
vpsrld ymm2, ymm0, 2 | |
vpslld ymm6, ymm0, 30 | |
vpor ymm2, ymm6, ymm2 | |
vpsrld ymm6, ymm0, 13 | |
vpslld ymm13, ymm0, 19 | |
vpor ymm6, ymm13, ymm6 | |
vpxor ymm2, ymm6, ymm2 | |
vpsrld ymm6, ymm0, 22 | |
vpslld ymm13, ymm0, 10 | |
vpor ymm6, ymm13, ymm6 | |
vpxor ymm2, ymm2, ymm6 | |
vpand ymm6, ymm0, ymm3 | |
vpxor ymm7, ymm6, ymm7 | |
vpand ymm13, ymm0, ymm9 | |
vpxor ymm7, ymm7, ymm13 | |
vpaddd ymm7, ymm2, ymm7 | |
vpaddd ymm2, ymm12, ymm4 | |
vpaddd ymm4, ymm7, ymm12 | |
vpsrld ymm7, ymm11, 17 | |
vpslld ymm12, ymm11, 15 | |
vpor ymm7, ymm12, ymm7 | |
vpsrld ymm12, ymm11, 19 | |
vpslld ymm13, ymm11, 13 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm11, ymm11, 10 | |
vpxor ymm7, ymm7, ymm11 | |
vpxor ymm7, ymm7, ymm12 | |
vmovdqa ymm14, ymmword ptr [rsp + 32] ## 32-byte Reload | |
vpsrld ymm11, ymm14, 7 | |
vpslld ymm12, ymm14, 25 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm14, 18 | |
vpslld ymm13, ymm14, 14 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm13, ymm14, 3 | |
vpxor ymm11, ymm11, ymm13 | |
vpxor ymm11, ymm11, ymm12 | |
vpaddd ymm11, ymm11, ymm15 | |
vpaddd ymm11, ymm11, ymmword ptr [rsp + 352] ## 32-byte Folded Reload | |
vpaddd ymm11, ymm11, ymm7 | |
vpsrld ymm7, ymm2, 6 | |
vpslld ymm12, ymm2, 26 | |
vpor ymm7, ymm12, ymm7 | |
vpsrld ymm12, ymm2, 11 | |
vpslld ymm13, ymm2, 21 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm7, ymm12, ymm7 | |
vpsrld ymm12, ymm2, 25 | |
vpslld ymm13, ymm2, 7 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm7, ymm7, ymm12 | |
vpand ymm12, ymm2, ymm1 | |
vpandn ymm13, ymm2, ymm8 | |
vpxor ymm12, ymm12, ymm13 | |
vpaddd ymm5, ymm11, ymm5 | |
vpaddd ymm5, ymm5, ymm12 | |
vpbroadcastd ymm12, dword ptr [rip + LCPI2_62] ## ymm12 = [2756734187,2756734187,2756734187,2756734187,2756734187,2756734187,2756734187,2756734187] | |
vpaddd ymm5, ymm5, ymm12 | |
vpaddd ymm12, ymm7, ymm5 | |
vpsrld ymm5, ymm4, 2 | |
vpslld ymm7, ymm4, 30 | |
vpor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm4, 13 | |
vpslld ymm13, ymm4, 19 | |
vpor ymm7, ymm13, ymm7 | |
vpxor ymm5, ymm7, ymm5 | |
vpsrld ymm7, ymm4, 22 | |
vpslld ymm13, ymm4, 10 | |
vpor ymm7, ymm13, ymm7 | |
vpxor ymm5, ymm5, ymm7 | |
vpand ymm7, ymm4, ymm0 | |
vpxor ymm6, ymm7, ymm6 | |
vpand ymm13, ymm4, ymm3 | |
vpxor ymm6, ymm6, ymm13 | |
vpaddd ymm6, ymm5, ymm6 | |
vpaddd ymm5, ymm12, ymm9 | |
vpaddd ymm6, ymm6, ymm12 | |
vpsrld ymm9, ymm10, 17 | |
vpslld ymm12, ymm10, 15 | |
vpor ymm9, ymm12, ymm9 | |
vpsrld ymm12, ymm10, 19 | |
vpslld ymm13, ymm10, 13 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm10, ymm10, 10 | |
vpxor ymm9, ymm9, ymm10 | |
vpxor ymm9, ymm9, ymm12 | |
vmovdqa ymm14, ymmword ptr [rsp + 160] ## 32-byte Reload | |
vpsrld ymm10, ymm14, 7 | |
vpslld ymm12, ymm14, 25 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm14, 18 | |
vpslld ymm13, ymm14, 14 | |
vpor ymm12, ymm13, ymm12 | |
vpsrld ymm13, ymm14, 3 | |
vpxor ymm10, ymm10, ymm13 | |
vpxor ymm10, ymm10, ymm12 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 32] ## 32-byte Folded Reload | |
vpaddd ymm10, ymm10, ymmword ptr [rsp + 64] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm5, 6 | |
vpslld ymm12, ymm5, 26 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm5, 11 | |
vpslld ymm13, ymm5, 21 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm10, ymm12, ymm10 | |
vpsrld ymm12, ymm5, 25 | |
vpslld ymm13, ymm5, 7 | |
vpor ymm12, ymm13, ymm12 | |
vpxor ymm10, ymm10, ymm12 | |
vpand ymm12, ymm5, ymm2 | |
vpandn ymm13, ymm5, ymm1 | |
vpxor ymm12, ymm12, ymm13 | |
vpaddd ymm8, ymm9, ymm8 | |
vpaddd ymm8, ymm8, ymm12 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_63] ## ymm9 = [3204031479,3204031479,3204031479,3204031479,3204031479,3204031479,3204031479,3204031479] | |
vpaddd ymm8, ymm8, ymm9 | |
vpaddd ymm9, ymm10, ymm8 | |
vpsrld ymm8, ymm6, 2 | |
vpslld ymm10, ymm6, 30 | |
vpor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm6, 13 | |
vpslld ymm12, ymm6, 19 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm8, ymm10, ymm8 | |
vpsrld ymm10, ymm6, 22 | |
vpslld ymm12, ymm6, 10 | |
vpor ymm10, ymm12, ymm10 | |
vpxor ymm10, ymm8, ymm10 | |
vpand ymm8, ymm6, ymm4 | |
vpxor ymm7, ymm8, ymm7 | |
vpand ymm12, ymm6, ymm0 | |
vpxor ymm7, ymm7, ymm12 | |
vpaddd ymm7, ymm10, ymm7 | |
vpaddd ymm3, ymm9, ymm3 | |
vpaddd ymm7, ymm7, ymm9 | |
vpsrld ymm9, ymm11, 17 | |
vpslld ymm10, ymm11, 15 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm11, 19 | |
vpslld ymm12, ymm11, 13 | |
vpor ymm10, ymm12, ymm10 | |
vpsrld ymm11, ymm11, 10 | |
vpxor ymm9, ymm9, ymm11 | |
vpxor ymm9, ymm9, ymm10 | |
vmovdqa ymm13, ymmword ptr [rsp + 320] ## 32-byte Reload | |
vpsrld ymm10, ymm13, 7 | |
vpslld ymm11, ymm13, 25 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm13, 18 | |
vpslld ymm12, ymm13, 14 | |
vpor ymm11, ymm12, ymm11 | |
vpsrld ymm12, ymm13, 3 | |
vpxor ymm10, ymm10, ymm12 | |
vpxor ymm10, ymm10, ymm11 | |
vpaddd ymm10, ymm10, ymm14 | |
vpaddd ymm10, ymm10, ymmword ptr [rsp] ## 32-byte Folded Reload | |
vpaddd ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm3, 6 | |
vpslld ymm11, ymm3, 26 | |
vpor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm3, 11 | |
vpslld ymm12, ymm3, 21 | |
vpor ymm11, ymm12, ymm11 | |
vpxor ymm10, ymm11, ymm10 | |
vpsrld ymm11, ymm3, 25 | |
vpslld ymm12, ymm3, 7 | |
vpor ymm11, ymm12, ymm11 | |
vpxor ymm10, ymm10, ymm11 | |
vpand ymm11, ymm3, ymm5 | |
vpandn ymm12, ymm3, ymm2 | |
vpxor ymm11, ymm11, ymm12 | |
vpaddd ymm1, ymm9, ymm1 | |
vpaddd ymm1, ymm1, ymm11 | |
vpbroadcastd ymm9, dword ptr [rip + LCPI2_64] ## ymm9 = [3329325298,3329325298,3329325298,3329325298,3329325298,3329325298,3329325298,3329325298] | |
vpaddd ymm1, ymm1, ymm9 | |
vpaddd ymm1, ymm10, ymm1 | |
vpsrld ymm9, ymm7, 2 | |
vpslld ymm10, ymm7, 30 | |
vpor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm7, 13 | |
vpslld ymm11, ymm7, 19 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm10, ymm9 | |
vpsrld ymm10, ymm7, 22 | |
vpslld ymm11, ymm7, 10 | |
vpor ymm10, ymm11, ymm10 | |
vpxor ymm9, ymm9, ymm10 | |
vpxor ymm10, ymm6, ymm4 | |
vpand ymm10, ymm7, ymm10 | |
vpxor ymm8, ymm10, ymm8 | |
vpaddd ymm8, ymm8, ymmword ptr [rsp + 640] ## 32-byte Folded Reload | |
vpaddd ymm8, ymm8, ymm9 | |
vpaddd ymm8, ymm8, ymm1 | |
vextracti128 xmmword ptr [rdi + 16], ymm8, 1 | |
vmovdqa xmmword ptr [rdi], xmm8 | |
vpaddd ymm7, ymm7, ymmword ptr [rsp + 704] ## 32-byte Folded Reload | |
vextracti128 xmmword ptr [rdi + 48], ymm7, 1 | |
vmovdqa xmmword ptr [rdi + 32], xmm7 | |
vpaddd ymm6, ymm6, ymmword ptr [rsp + 768] ## 32-byte Folded Reload | |
vextracti128 xmmword ptr [rdi + 80], ymm6, 1 | |
vmovdqa xmmword ptr [rdi + 64], xmm6 | |
vpaddd ymm4, ymm4, ymmword ptr [rsp + 832] ## 32-byte Folded Reload | |
vextracti128 xmmword ptr [rdi + 112], ymm4, 1 | |
vmovdqa xmmword ptr [rdi + 96], xmm4 | |
vpaddd ymm0, ymm0, ymmword ptr [rsp + 672] ## 32-byte Folded Reload | |
vpaddd ymm0, ymm0, ymm1 | |
vextracti128 xmmword ptr [rdi + 144], ymm0, 1 | |
vmovdqa xmmword ptr [rdi + 128], xmm0 | |
vpaddd ymm0, ymm3, ymmword ptr [rsp + 736] ## 32-byte Folded Reload | |
vextracti128 xmmword ptr [rdi + 176], ymm0, 1 | |
vmovdqa xmmword ptr [rdi + 160], xmm0 | |
vpaddd ymm0, ymm5, ymmword ptr [rsp + 800] ## 32-byte Folded Reload | |
vextracti128 xmmword ptr [rdi + 208], ymm0, 1 | |
vmovdqa xmmword ptr [rdi + 192], xmm0 | |
vpaddd ymm0, ymm2, ymmword ptr [rsp + 864] ## 32-byte Folded Reload | |
vextracti128 xmmword ptr [rdi + 240], ymm0, 1 | |
vmovdqa xmmword ptr [rdi + 224], xmm0 | |
mov rax, qword ptr [rip + ___stack_chk_guard@GOTPCREL] | |
mov rax, qword ptr [rax] | |
cmp rax, qword ptr [rsp + 2952] | |
jne LBB2_4 | |
## BB#3: | |
mov rsp, rbp | |
pop rbp | |
vzeroupper | |
ret | |
LBB2_4: | |
vzeroupper | |
call ___stack_chk_fail | |
## -- End function | |
.section __TEXT,__const | |
.p2align 5 ## -- Begin function Sha256Final8x | |
LCPI3_0: | |
.byte 3 ## 0x3 | |
.byte 2 ## 0x2 | |
.byte 1 ## 0x1 | |
.byte 0 ## 0x0 | |
.byte 7 ## 0x7 | |
.byte 6 ## 0x6 | |
.byte 5 ## 0x5 | |
.byte 4 ## 0x4 | |
.byte 11 ## 0xb | |
.byte 10 ## 0xa | |
.byte 9 ## 0x9 | |
.byte 8 ## 0x8 | |
.byte 15 ## 0xf | |
.byte 14 ## 0xe | |
.byte 13 ## 0xd | |
.byte 12 ## 0xc | |
.byte 3 ## 0x3 | |
.byte 2 ## 0x2 | |
.byte 1 ## 0x1 | |
.byte 0 ## 0x0 | |
.byte 7 ## 0x7 | |
.byte 6 ## 0x6 | |
.byte 5 ## 0x5 | |
.byte 4 ## 0x4 | |
.byte 11 ## 0xb | |
.byte 10 ## 0xa | |
.byte 9 ## 0x9 | |
.byte 8 ## 0x8 | |
.byte 15 ## 0xf | |
.byte 14 ## 0xe | |
.byte 13 ## 0xd | |
.byte 12 ## 0xc | |
.section __TEXT,__text,regular,pure_instructions | |
.globl _Sha256Final8x | |
_Sha256Final8x: ## @Sha256Final8x | |
## BB#0: | |
push rbp | |
mov rbp, rsp | |
push r15 | |
push r14 | |
push r13 | |
push r12 | |
push rbx | |
and rsp, -16 | |
sub rsp, 16 | |
mov qword ptr [rsp], r9 ## 8-byte Spill | |
mov r15, r8 | |
mov r12, rcx | |
mov r13, rdx | |
mov r14, rsi | |
mov rbx, rdi | |
mov eax, dword ptr [rbx + 768] | |
xor ecx, ecx | |
xor edx, edx | |
cmp eax, 56 | |
jl LBB3_5 | |
jmp LBB3_1 | |
LBB3_8: ## in Loop: Header=BB3_5 Depth=1 | |
mov eax, dword ptr [rbx + 768] | |
add ecx, 64 | |
LBB3_5: ## =>This Loop Header: Depth=1 | |
## Child Loop BB3_6 Depth 2 | |
mov sil, -128 | |
LBB3_6: ## Parent Loop BB3_5 Depth=1 | |
## => This Inner Loop Header: Depth=2 | |
lea edi, [rcx + rax] | |
inc eax | |
mov byte ptr [rbx + rdi + 256], sil | |
xor esi, esi | |
cmp eax, 64 | |
jb LBB3_6 | |
## BB#7: ## in Loop: Header=BB3_5 Depth=1 | |
inc edx | |
cmp edx, 8 | |
jne LBB3_8 | |
jmp LBB3_10 | |
LBB3_4: ## in Loop: Header=BB3_1 Depth=1 | |
mov eax, dword ptr [rbx + 768] | |
add ecx, 64 | |
LBB3_1: ## =>This Loop Header: Depth=1 | |
## Child Loop BB3_2 Depth 2 | |
mov sil, -128 | |
LBB3_2: ## Parent Loop BB3_1 Depth=1 | |
## => This Inner Loop Header: Depth=2 | |
lea edi, [rcx + rax] | |
inc eax | |
mov byte ptr [rbx + rdi + 256], sil | |
xor esi, esi | |
cmp eax, 64 | |
jb LBB3_2 | |
## BB#3: ## in Loop: Header=BB3_1 Depth=1 | |
inc edx | |
cmp edx, 8 | |
jne LBB3_4 | |
## BB#9: | |
lea rsi, [rbx + 256] | |
mov rdi, rbx | |
call _sha256_transform8x | |
vxorps xmm0, xmm0, xmm0 | |
vmovups xmmword ptr [rbx + 272], xmm0 | |
vmovups xmmword ptr [rbx + 256], xmm0 | |
vmovups xmmword ptr [rbx + 304], xmm0 | |
vmovups xmmword ptr [rbx + 288], xmm0 | |
vmovups xmmword ptr [rbx + 336], xmm0 | |
vmovups xmmword ptr [rbx + 320], xmm0 | |
vmovups xmmword ptr [rbx + 368], xmm0 | |
vmovups xmmword ptr [rbx + 352], xmm0 | |
vmovups xmmword ptr [rbx + 400], xmm0 | |
vmovups xmmword ptr [rbx + 384], xmm0 | |
vmovups xmmword ptr [rbx + 432], xmm0 | |
vmovups xmmword ptr [rbx + 416], xmm0 | |
vmovups xmmword ptr [rbx + 464], xmm0 | |
vmovups xmmword ptr [rbx + 448], xmm0 | |
vmovups xmmword ptr [rbx + 496], xmm0 | |
vmovups xmmword ptr [rbx + 480], xmm0 | |
vmovups xmmword ptr [rbx + 528], xmm0 | |
vmovups xmmword ptr [rbx + 512], xmm0 | |
vmovups xmmword ptr [rbx + 560], xmm0 | |
vmovups xmmword ptr [rbx + 544], xmm0 | |
vmovups xmmword ptr [rbx + 592], xmm0 | |
vmovups xmmword ptr [rbx + 576], xmm0 | |
vmovups xmmword ptr [rbx + 624], xmm0 | |
vmovups xmmword ptr [rbx + 608], xmm0 | |
vmovups xmmword ptr [rbx + 656], xmm0 | |
vmovups xmmword ptr [rbx + 640], xmm0 | |
vmovups xmmword ptr [rbx + 688], xmm0 | |
vmovups xmmword ptr [rbx + 672], xmm0 | |
LBB3_10: | |
movsxd r11, dword ptr [rbx + 768] | |
shl r11, 3 | |
add r11, qword ptr [rbx + 776] | |
mov qword ptr [rbx + 776], r11 | |
mov r8, r11 | |
shr r8, 8 | |
mov r9, r11 | |
shr r9, 16 | |
mov r10, r11 | |
shr r10, 24 | |
mov rdi, r11 | |
shr rdi, 32 | |
mov rax, r11 | |
shr rax, 40 | |
mov rcx, r11 | |
shr rcx, 48 | |
mov rdx, r11 | |
shr rdx, 56 | |
mov esi, 319 | |
LBB3_11: ## =>This Inner Loop Header: Depth=1 | |
mov byte ptr [rbx + rsi], r11b | |
mov byte ptr [rbx + rsi - 1], r8b | |
mov byte ptr [rbx + rsi - 2], r9b | |
mov byte ptr [rbx + rsi - 3], r10b | |
mov byte ptr [rbx + rsi - 4], dil | |
mov byte ptr [rbx + rsi - 5], al | |
mov byte ptr [rbx + rsi - 6], cl | |
mov byte ptr [rbx + rsi - 7], dl | |
add rsi, 64 | |
cmp rsi, 831 | |
jne LBB3_11 | |
## BB#12: | |
lea rsi, [rbx + 256] | |
mov rdi, rbx | |
call _sha256_transform8x | |
vmovdqa xmm0, xmmword ptr [rbx] | |
vmovdqa xmm1, xmmword ptr [rbx + 32] | |
vmovdqa xmm2, xmmword ptr [rbx + 64] | |
vmovdqa xmm3, xmmword ptr [rbx + 96] | |
vinserti128 ymm0, ymm0, xmmword ptr [rbx + 16], 1 | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 48], 1 | |
vpunpckldq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] | |
vpunpckhdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] | |
vinserti128 ymm1, ymm2, xmmword ptr [rbx + 80], 1 | |
vinserti128 ymm2, ymm3, xmmword ptr [rbx + 112], 1 | |
vpunpckldq ymm3, ymm1, ymm2 ## ymm3 = ymm1[0],ymm2[0],ymm1[1],ymm2[1],ymm1[4],ymm2[4],ymm1[5],ymm2[5] | |
vpunpckhdq ymm1, ymm1, ymm2 ## ymm1 = ymm1[2],ymm2[2],ymm1[3],ymm2[3],ymm1[6],ymm2[6],ymm1[7],ymm2[7] | |
vmovdqa xmm2, xmmword ptr [rbx + 128] | |
vinserti128 ymm2, ymm2, xmmword ptr [rbx + 144], 1 | |
vmovdqa xmm5, xmmword ptr [rbx + 160] | |
vinserti128 ymm5, ymm5, xmmword ptr [rbx + 176], 1 | |
vpunpckldq ymm6, ymm2, ymm5 ## ymm6 = ymm2[0],ymm5[0],ymm2[1],ymm5[1],ymm2[4],ymm5[4],ymm2[5],ymm5[5] | |
vpunpckhdq ymm2, ymm2, ymm5 ## ymm2 = ymm2[2],ymm5[2],ymm2[3],ymm5[3],ymm2[6],ymm5[6],ymm2[7],ymm5[7] | |
vmovdqa xmm5, xmmword ptr [rbx + 192] | |
vinserti128 ymm5, ymm5, xmmword ptr [rbx + 208], 1 | |
vmovdqa xmm7, xmmword ptr [rbx + 224] | |
vinserti128 ymm7, ymm7, xmmword ptr [rbx + 240], 1 | |
vpunpckldq ymm8, ymm5, ymm7 ## ymm8 = ymm5[0],ymm7[0],ymm5[1],ymm7[1],ymm5[4],ymm7[4],ymm5[5],ymm7[5] | |
vpunpckhdq ymm5, ymm5, ymm7 ## ymm5 = ymm5[2],ymm7[2],ymm5[3],ymm7[3],ymm5[6],ymm7[6],ymm5[7],ymm7[7] | |
vpunpcklqdq ymm7, ymm4, ymm3 ## ymm7 = ymm4[0],ymm3[0],ymm4[2],ymm3[2] | |
vpunpckhqdq ymm3, ymm4, ymm3 ## ymm3 = ymm4[1],ymm3[1],ymm4[3],ymm3[3] | |
vpunpcklqdq ymm4, ymm0, ymm1 ## ymm4 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] | |
vpunpckhqdq ymm0, ymm0, ymm1 ## ymm0 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] | |
vpunpcklqdq ymm9, ymm6, ymm8 ## ymm9 = ymm6[0],ymm8[0],ymm6[2],ymm8[2] | |
vpunpckhqdq ymm6, ymm6, ymm8 ## ymm6 = ymm6[1],ymm8[1],ymm6[3],ymm8[3] | |
vpunpcklqdq ymm8, ymm2, ymm5 ## ymm8 = ymm2[0],ymm5[0],ymm2[2],ymm5[2] | |
vpunpckhqdq ymm2, ymm2, ymm5 ## ymm2 = ymm2[1],ymm5[1],ymm2[3],ymm5[3] | |
vinserti128 ymm1, ymm7, xmm9, 1 | |
vmovdqa xmmword ptr [rbx + 16], xmm9 | |
vmovdqa xmmword ptr [rbx], xmm7 | |
vmovdqa xmmword ptr [rbx + 48], xmm6 | |
vmovdqa xmmword ptr [rbx + 32], xmm3 | |
vmovdqa xmmword ptr [rbx + 80], xmm8 | |
vmovdqa xmmword ptr [rbx + 64], xmm4 | |
vmovdqa xmmword ptr [rbx + 112], xmm2 | |
vmovdqa xmmword ptr [rbx + 96], xmm0 | |
vperm2i128 ymm5, ymm7, ymm9, 49 ## ymm5 = ymm7[2,3],ymm9[2,3] | |
vextracti128 xmmword ptr [rbx + 144], ymm5, 1 | |
vmovdqa xmmword ptr [rbx + 128], xmm5 | |
vperm2i128 ymm3, ymm3, ymm6, 49 ## ymm3 = ymm3[2,3],ymm6[2,3] | |
vextracti128 xmmword ptr [rbx + 176], ymm3, 1 | |
vmovdqa xmmword ptr [rbx + 160], xmm3 | |
vperm2i128 ymm3, ymm4, ymm8, 49 ## ymm3 = ymm4[2,3],ymm8[2,3] | |
vextracti128 xmmword ptr [rbx + 208], ymm3, 1 | |
vmovdqa xmmword ptr [rbx + 192], xmm3 | |
vperm2i128 ymm0, ymm0, ymm2, 49 ## ymm0 = ymm0[2,3],ymm2[2,3] | |
vextracti128 xmmword ptr [rbx + 240], ymm0, 1 | |
vmovdqa xmmword ptr [rbx + 224], xmm0 | |
vmovdqa ymm0, ymmword ptr [rip + LCPI3_0] ## ymm0 = [3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12,3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12] | |
vpshufb ymm1, ymm1, ymm0 | |
vextracti128 xmmword ptr [r14 + 16], ymm1, 1 | |
vmovdqu xmmword ptr [r14], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 32] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 48], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
vextracti128 xmmword ptr [r13 + 16], ymm1, 1 | |
vmovdqu xmmword ptr [r13], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 64] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 80], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
vextracti128 xmmword ptr [r12 + 16], ymm1, 1 | |
vmovdqu xmmword ptr [r12], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 96] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 112], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
vextracti128 xmmword ptr [r15 + 16], ymm1, 1 | |
vmovdqu xmmword ptr [r15], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 128] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 144], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
mov rax, qword ptr [rsp] ## 8-byte Reload | |
vextracti128 xmmword ptr [rax + 16], ymm1, 1 | |
vmovdqu xmmword ptr [rax], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 160] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 176], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
mov rax, qword ptr [rbp + 16] | |
vextracti128 xmmword ptr [rax + 16], ymm1, 1 | |
vmovdqu xmmword ptr [rax], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 192] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 208], 1 | |
vpshufb ymm1, ymm1, ymm0 | |
mov rax, qword ptr [rbp + 24] | |
vextracti128 xmmword ptr [rax + 16], ymm1, 1 | |
vmovdqu xmmword ptr [rax], xmm1 | |
vmovdqa xmm1, xmmword ptr [rbx + 224] | |
vinserti128 ymm1, ymm1, xmmword ptr [rbx + 240], 1 | |
vpshufb ymm0, ymm1, ymm0 | |
mov rax, qword ptr [rbp + 32] | |
vextracti128 xmmword ptr [rax + 16], ymm0, 1 | |
vmovdqu xmmword ptr [rax], xmm0 | |
lea rsp, [rbp - 40] | |
pop rbx | |
pop r12 | |
pop r13 | |
pop r14 | |
pop r15 | |
pop rbp | |
vzeroupper | |
ret | |
## -- End function |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment