Skip to content

Instantly share code, notes, and snippets.

@arademaker
Created June 6, 2020 18:30
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save arademaker/e10d43992287008ef044630d5ab12e9c to your computer and use it in GitHub Desktop.
Save arademaker/e10d43992287008ef044630d5ab12e9c to your computer and use it in GitHub Desktop.
ar@leme udp % awk '$3 ~ /^(irmã|irmão|pai|mãe|tio|tia|bisavô|bisavó|primo|prima|avô|avó|sobrinho|sobrinha|cunhado|cunhada|parente)$/ {print $2,$3}' *.conllu | sort | uniq -c | sort -nr
1622 pai pai
1283 irmão irmão
336 tio tio
336 irmãos irmão
315 Sobrinho sobrinho
277 avô avô
272 primo primo
256 mãe mãe
188 sobrinho sobrinho
172 parentes parente
131 irmã irmã
122 pais pai
85 cunhado cunhado
62 primos primo
37 bisavô bisavô
34 tios tio
30 sobrinhos sobrinho
29 parente parente
27 prima primo
24 sobrinha sobrinha
20 mães pai
19 avós avó
18 avó avó
16 tia tia
13 irmãs irmã
11 cunhada cunhada
11 Irmão irmão
10 Pai pai
9 Mãe mãe
8 prima prima
7 PAI pai
6 cunhados cunhado
5 irmãs irmão
4 irmã irmão
4 bisavó bisavó
4 Irmã irmã
2 tias tia
2 Prima prima
2 Parentes parente
1 primas primo
1 SOBRINHO sobrinho
1 Parente parente
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment