Data Mining

Die Studierenden sollen grundlegende Techniken des Data Minings kennenlernen und die aktuelle Relevanz dieses aktuell stark beforschten Wissensgebietes einschätzen können.

Kann man mit Twitter Daten den Ausgang der Bundestagswahl vorhersagen?
Wie deckt man in sozialen Netzwerken oder anhand von Verbindungsdaten Gruppen von Individuen auf, die zusammen gehören?  Wie erzeugt man Profile von Internetnutzern, um deren Verhalten vorherzusagen oder Werbemaßnahmen zielgerecht zu platzieren? Wie betreibt man Meinungsforschung im Internet, also z.B. ob ein bestimmter Text einem Produkt positiv oder negativ gegenübersteht?

Mit diesen Fragen, die von großem ökonomischen und politischen Interesse sind und gegenwärtig stark beforscht werden, wird sich das WPF Data Mining beschäftigen.

Die ersten Sitzungen werden in Vorlesungsform gestaltet. Es werden Grundlagen des Data Minings behandelt. Dazu gehören überwachte und nicht überwachte Lernverfahren, insbesondere

  • Überwachtes Lernen
  • Entscheidungsbäume
  • K-NN
  • Naïve Bayes 
  • Support Vector Machines
  • Neuronale Netze
  • Nicht überwachtes Lernen
  • Clustering
  • Assoziationsanalyse

Als Tools zur praktischen Umsetzung werden wir Python und R nutzen. Zu Beginn wird es einen Python-Einführungskurs geben.

M
M