Final möchte wir mittels maschinellen Lernens Texte automatisch
analysieren. Auch hier wollen wir an einem kleinen Beispiel das
Verständnis für die Grundlagen und mögliche Anwendungen entwickelt. In
dem Beispiel werden wir Texte in Kategorien zuordnen und somit ein
kleines automatisches Verschlagwortungswerkzeug erstellen. Dazu bauen
wir auf das in der letzte Woche Erlernte zu Klassifizierugsverfahren,
aber auch auf einige Punkte aus Modul 2 namentlich Term-Frequency (TF)
und und Term frequency inverse document
frequency (TFIDF),
auf. Für die Implementation greifen wir wieder auf scikit-learn
zurück.
Bitte nutz den Ordner machine_learning
in Deinem Modul-Ordner und
erstelle darin einen ein Jupyter-Notebook names Text-Analyse
. Die
Einreichung der Ergebnisse erfolgt über einen Commit bis zum
Präsenztag. Musterlösungen sind hier zu finden.