Machinelles Lernen - Automatische Textanalyse

Zielsetzung

Final möchte wir mittels maschinellen Lernens Texte automatisch analysieren. Auch hier wollen wir an einem kleinen Beispiel das Verständnis für die Grundlagen und mögliche Anwendungen entwickelt. In dem Beispiel werden wir Texte in Kategorien zuordnen und somit ein kleines automatisches Verschlagwortungswerkzeug erstellen. Dazu bauen wir auf das in der letzte Woche Erlernte zu Klassifizierugsverfahren, aber auch auf einige Punkte aus Modul 2 namentlich Term-Frequency (TF) und und Term frequency inverse document frequency (TFIDF), auf. Für die Implementation greifen wir wieder auf scikit-learn zurück.

Bitte nutz den Ordner machine_learning in Deinem Modul-Ordner und erstelle darin einen ein Jupyter-Notebook names Text-Analyse. Die Einreichung der Ergebnisse erfolgt über einen Commit bis zum Präsenztag. Musterlösungen sind hier zu finden.