dingmaotu/fast-remove-redis-keys.py

## fast-remove-redis-keys.py
# to remove all keys matching a pattern in redis
# we could use the recommended way: redis-cli --scan --pattern 'abc:*' | xargs redis-cli del
# but this can be very slow if you have lots of data (like 8G redis cluster)
# we can use the following script to remove keys (considerably faster)

import time
import logging
from rediscluster import StrictRedisCluster

logger = logging.getLogger(__name__)
client = StrictRedisCluster(startup_nodes=hosts, password=password,
                                    skip_full_coverage_check=True)

pattern = "abc:*"
start_time = time.time()
item_count = 0
batch_size = 100000
keys = []

logger.info("Start scanning keys...")

for k in client.scan_iter(pattern, count=batch_size):
    keys.append(k)
    if len(keys) >= batch_size:
        item_count += len(keys)
        logger.info("batch delete to {} ...".format(item_count))

        client.delete(*keys)
        keys = []

if len(keys) > 0:
    item_count += len(keys)
    logger.info("batch delete to {}".format(item_count))

    client.delete(*keys)

end_time = time.time()

logger.info("deleted {0} keys in {1:0.3f} ms.".format(item_count, (end_time - start_time) / 1000.0))