Skip to content

Instantly share code, notes, and snippets.

@PavelJurasek
Forked from kokes/cz.py
Created March 3, 2020 20:38
Show Gist options
  • Save PavelJurasek/22045ca354a465bdfbf7209ec9f7bc14 to your computer and use it in GitHub Desktop.
Save PavelJurasek/22045ca354a465bdfbf7209ec9f7bc14 to your computer and use it in GitHub Desktop.
czech domains potentially/really affected by https://letsencrypt.org/caaproblem/ (using data from Alexa top 1m)
# https://letsencrypt.org/caaproblem/
import re
import gzip
from tqdm import tqdm
fn = 'caa-rechecking-incident-affected-serials.txt.gz'
rr = re.compile(r'[\[\]\s]')
domains = set()
with gzip.open(fn, 'rt') as f:
for ln in tqdm(f):
if '.cz' not in ln: continue
new_ones = rr.split(ln)
new_ones = [j for j in new_ones if j.endswith('.cz')]
domains.update(new_ones)
with open('cz.txt', 'w') as fw:
for domain in sorted(list(domains)):
fw.write(domain)
fw.write('\n')
# domains affected (as checked by the curl call listed on the website linked)
agel.cz
audigo.cz
autouh.cz
bydleni.cz
ekolo.cz
freevidea.cz
horux.cz
hoteltheatrino.cz
isspolygr.cz
itvar.cz
knife.cz
libimseti.cz
magistra.cz
mycrafts.cz
nic.cz
o2chytraskola.cz
oabrno.cz
one3d.cz
posters.cz
radio.cz
reedog.cz
seznamzpravy.cz
sharplayers.cz
slevykurzu.cz
smeny.cz
sms.cz
sousede.cz
sssbrno.cz
xtv.cz
yrno.cz
# top-1m.csv: http://s3.amazonaws.com/alexa-static/top-1m.csv.zip
cz = set()
with open('cz.txt') as f:
for ln in f:
cz.add(ln.strip())
with open('top-1m.csv') as f:
for ln in f:
_, _, url = ln.partition(',')
url = url.strip()
if '.cz' in url and url in cz:
print(url)
# POTENTIALLY affected domains, as cross referenced against the Alexa DB
1001hry.cz
100mega.cz
active24.cz
agel.cz
akropolis.cz
archiweb.cz
arfa.cz
artisan.cz
audigo.cz
autodoc.cz
autogames.cz
autokelly.cz
autouh.cz
autoweb.cz
bandzone.cz
bazar.cz
besttour.cz
blog.cz
brno.cz
bydleni.cz
cas.cz
centrum.cz
ceskatelevize.cz
ceskereality.cz
cpp.cz
csas.cz
cuni.cz
cvut.cz
dek.cz
disk.cz
dm.cz
drmax.cz
ekolo.cz
elit.cz
email.cz
firmy.cz
freevidea.cz
garaz.cz
gme.cz
gohome.cz
gopay.cz
gov.cz
gymkren.cz
horoskopy.cz
horux.cz
hoteltheatrino.cz
idnes.cz
internetbanka.cz
interprace.cz
iprima.cz
isotra.cz
isspolygr.cz
itesco.cz
itvar.cz
izus.cz
justnahrin.cz
kafe.cz
kaufland.cz
knife.cz
kompresory-chlazeni.cz
kosik.cz
krajskelisty.cz
kzvalmez.cz
labicom.cz
libimseti.cz
lide.cz
lingea.cz
ls-novinky.cz
lupa.cz
magistra.cz
mapy.cz
mistopisy.cz
moneta.cz
moravskereality.cz
muni.cz
mvcr.cz
mycrafts.cz
navratdoreality.cz
nic.cz
nova.cz
novinky.cz
o2.cz
o2chytraskola.cz
oabrno.cz
one3d.cz
parfemy.cz
pepco.cz
play.cz
posters.cz
postovnezdarma.cz
profikraft.cz
profizoo.cz
prozeny.cz
radio.cz
realitymix.cz
reedog.cz
ronnie.cz
root.cz
rozhlas.cz
sauto.cz
sbazar.cz
seznam.cz
seznamzpravy.cz
sharplayers.cz
slevykurzu.cz
smeny.cz
sms.cz
sousede.cz
sport.cz
sreality.cz
sssbrno.cz
sstebrno.cz
stob.cz
suenee.cz
super.cz
svitavy.cz
szn.cz
tamilgun.cz
televizeseznam.cz
tiscali.cz
toplist.cz
tork.cz
travian.cz
unicreditbank.cz
upol.cz
vareni.cz
vinegret.cz
vsb.cz
vse.cz
vutbr.cz
websnadno.cz
xtv.cz
yrno.cz
zbozi.cz
zcu.cz
znamylekar.cz
zonky.cz
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment