Machinelles Lernen - Automatische Textanalyse

Zielsetzung

Final möchte wir mittels maschinellen Lernens Texte automatisch analysieren. Auch hier wollen wir an einem kleinen Beispiel das Verständnis für die Grundlagen und mögliche Anwendungen entwickelt. In dem Beispiel werden wir Texte in Kategorien zuordnen und somit ein kleines automatisches Verschlagwortungswerkzeug erstellen. Dazu bauen wir auf das in der letzte Woche Erlernte zu Klassifizierugsverfahren, aber auch auf einige Punkte aus Modul 2 namentlich Text-Frequency (TF) und und Term frequency inverse document frequency (TFIDF)), auf. Für die Implementation greifen wir wieder scikit-learn zurück.

Bitte nutzen Sie den Ordner machine_learning in ihrem Modul-Ordner und erstellen Sie darin einen ein Jupyter-Notebook names Text-Analyse. Die Einreichung der Ergebnisse erfolgt über einen Commit bis zum Präsenztag. Musterlösungen sind hier zu finden.