Skip to content

Instantly share code, notes, and snippets.

@paulsonnentag
Created November 7, 2016 11:34
Show Gist options
  • Save paulsonnentag/cba259cc13f9fa093e62d896fd7074eb to your computer and use it in GitHub Desktop.
Save paulsonnentag/cba259cc13f9fa093e62d896fd7074eb to your computer and use it in GitHub Desktop.

Natural Language Processing

Vorlesung 5

Woring unterscheiden sich stemming und lemmatisierung?

Stemming reduziert das Wort auf den Stamm, dies muss kein gültiges Wort sein. Die Lemmatisierung bildet das Wort auf die Grundform ab.

Wie ermittelt der Porter Stemmer den Stamm eines Wortes?

Das zu prüfende Worte wird von hinten durchgegangen. Tritt diese Endung allgemein in Wörtern häufig auf wird der Teil abgeschnitten. Es wird kein Wörterbuch der Sprache benötigt.

Wie wird die Ähnlichkeit zwischen Wörtern bestimmt?

Die minimale Anzahl der Editieroperationen (Insert, Delete, Replace) um von einem Wort zum Anderen zu kommen.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment