Skip to content

Instantly share code, notes, and snippets.

@ljos
Last active August 29, 2015 14:17
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 1 You must be signed in to fork a gist
  • Save ljos/395d2a755cb6c4c20ca7 to your computer and use it in GitHub Desktop.
Save ljos/395d2a755cb6c4c20ca7 to your computer and use it in GitHub Desktop.
OBT hjelpeskript
#!/usr/bin/env bash
input_file="${1:-/dev/stdin}"
sed '/^\s*$/d' "$input_file" \
| paste -d '\t\0' - - - \
| sed -e 's/\([^"]*\)$/\t\1/' \
-e 's,<word>\(.*\)</word>,\1,' \
-e 's/"<\(.*\)>"\t"\(.*\)"/\1\t\2/' \
| cut -f3 \
| sed 's/./\L\0/g'
@ljos
Copy link
Author

ljos commented Mar 16, 2015

Det dette skriptet gjør er:

  • Sett input_file til enten først argumentet, eller stdin.
    • Fjern alle tomme linjer.
    • Slå sammen 4 og 4 linjer.
    • Sett tabulator foran det 3. ordet.
    • Fjern <word></word> taggen.
    • Fjern "<>" og "" rundt ordene.
    • Ta den tredje kolonnen.
    • Konverter til små bokstaver.

Du må først bruke OBT og OBT-Stat programmene for at dette skriptet skal gjøre det riktige.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment