lttzzlll/md5_mutlithread.py

## md5_mutlithread.py
import hashlib
from concurrent import futures
import os
import time
from itertools import chain
from functools import wraps


def timeit(func):
    @wraps(func)
    def wrapper(*args, **kwargs):
        start = time.time()
        res = func(*args, **kwargs)
        end = time.time()
        print('function {} cost {}'.format(func.__name__, end - start))
        return res
    return wrapper


def md5(fname):
    hash_md5 = hashlib.md5()
    with open(fname, "rb") as f:
        map(hash_md5.update, iter(lambda: f.read(4096), b""))
    return hash_md5.hexdigest()


def compare_many(cmp_list):

    cmp_list = list(chain(*cmp_list))

    with futures.ThreadPoolExecutor(max_workers=len(cmp_list)) as executor:
        res = list(executor.map(md5, cmp_list))

        for i in range(0, len(res), 2):
            print('A={}, B={}, A==B ? {}'.format(
                res[i], res[i + 1], res[i] == res[i + 1]))

@timeit
def test():
    a, b = r'\\ccpsofsep\am_s1\users\v-taotli\FRA\UnifiedModelBaselinePreparation\tmp\fr-FR.ULM.allflavor.arpa',  r'\\ccpsofsep\am_s1\users\v-taotli\FRA\UnifiedModelBaselinePreparation\20171218_allflavor\fr-FR.ULM.allflavor.arpa.rm'
    c = [(a, b) for i in range(1000)]
    compare_many(c)


if __name__ == '__main__':
    test()
# function test cost 1.2680234909057617
	import hashlib
	from concurrent import futures
	import os
	import time
	from itertools import chain
	from functools import wraps


	def timeit(func):
	@wraps(func)
	def wrapper(args, *kwargs):
	start = time.time()
	res = func(args, *kwargs)
	end = time.time()
	print('function {} cost {}'.format(func.__name__, end - start))
	return res
	return wrapper


	def md5(fname):
	hash_md5 = hashlib.md5()
	with open(fname, "rb") as f:
	map(hash_md5.update, iter(lambda: f.read(4096), b""))
	return hash_md5.hexdigest()


	def compare_many(cmp_list):

	cmp_list = list(chain(*cmp_list))

	with futures.ThreadPoolExecutor(max_workers=len(cmp_list)) as executor:
	res = list(executor.map(md5, cmp_list))

	for i in range(0, len(res), 2):
	print('A={}, B={}, A==B ? {}'.format(
	res[i], res[i + 1], res[i] == res[i + 1]))

	@timeit
	def test():
	a, b = r'\\ccpsofsep\am_s1\users\v-taotli\FRA\UnifiedModelBaselinePreparation\tmp\fr-FR.ULM.allflavor.arpa', r'\\ccpsofsep\am_s1\users\v-taotli\FRA\UnifiedModelBaselinePreparation\20171218_allflavor\fr-FR.ULM.allflavor.arpa.rm'
	c = [(a, b) for i in range(1000)]
	compare_many(c)


	if __name__ == '__main__':
	test()
	# function test cost 1.2680234909057617