Skip to content

Instantly share code, notes, and snippets.

@dewomser
Last active May 14, 2025 06:14
Show Gist options
  • Select an option

  • Save dewomser/e41f3df6ced9aea49f1aa166a07209d1 to your computer and use it in GitHub Desktop.

Select an option

Save dewomser/e41f3df6ced9aea49f1aa166a07209d1 to your computer and use it in GitHub Desktop.
read the newspaper and find items in text and images. A Bash 1-liner

Linux Bash - Textanalyse

Wie oft und in welchem Zusammenhang kommt auf einer Webseite ein bestimmter Begriff vor. Es wird Bild und Text berücksichtigt

Funktioniert mit Titelseiten von Tageszeitungen FAZ, TAZ, Bild …

  1. Firefox Profil anlegen ohne Adblocker und alle Cookies erlaubt, genannt "screenshot"
  2. dieser EInzeiler;
firefox https://faz.net -P screenshot --browser --screenshot ~/Downloads/bild.png ; tesseract -l deu ~/Downloads/bild.png bild ; grep -E  '[F,f]rau' bild.txt
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment