Heidelberg University

Mathematische Statistik beim Maschinellen Lernen

Wintersemester 2019/2020


Organisation

Dozenten:

Seminar

  • Zeit: An Dienstagen, in Blöcken, 14 - 18 Uhr
  • Ort: Mathematikon, Seminarraum 6

Vorbesprechung und Deadline für Anmeldungen

Dienstag, 15.10.2019, 15:00 Uhr in INF205/Seminarraum 6. Die Anmeldung erfolgt per Mail an Stefan Richter.

Seminar-Klassifizierung

Das Seminar ist ein Master-Seminar im Bereich Angewandte Mathematik.
Leistungspunkte: 6

Vorwissen

  • Vorlesungen in Wahrscheinlichkeitstheorie und Statistik (insbes. Wahrscheinlichkeitstheorie 1).
  • Sichere Kenntnisse im Bereich bedingte Erwartungswerte, bedingte Verteilungen, Eigenwerte, Spektralsatz.
  • Möglichst Kenntnisse der Programmiersprache R, s.u. (z.B. Besuch der Vorlesung "Die Programmiersprache R" in WS2018/2019)
  • Für einige Vorträge können Basiskenntnisse in Funktionalanalysis / Large Deviation Inequalities nützlich sein, aber auch im Laufe der Vorbereitung angeeignet werden.

Inhalt

Das Seminar orientiert sich am Buch "Statistisches und Maschinelles Lernen" (Springer 2019).

Online-Aufruf über Universitäts-Bibliothek: Link.

Die meisten Vorträge sind thematisch unabhängig voneinander.

Themen:
TagVortragendeThema
Di, 29.10.2019Stefan RichterEinführung (Folien)
Di, 19.11.2019Niklas WünstelLineare Algorithmen für Regression (Folien)
Leonie KreisSupport Vector Machines Teil 1 (Folien)
Tim ReitzeSupport Vector Machines Teil 2 (Folien)
Di, 26.11.2019René BucchiaNichtparametrische Methoden und Naiver Bayes-Schätzer (Folien, Shiny R Quellcode)
Bérénice RobertEinführung Bäume (Folien)
Ricardo BlumBagging von Bäumen und Random Forests (Folien)
Robin ViellieberBoosting von Bäumen (Folien)
Di, 03.12.2019Moritz Haas Neuronale Netzwerke 1 (Folien)
Kay ZaradnyNeuronale Netzwerke 2 (Folien)
Stefan RichterReinforcement Learning (Folien)
Di, 10.12.2019Fritz Schelten k-means Clustering und EM-Algorithmus (Folien)
Michael BudjanHauptkomponentenanalyse (Folien)
Leon HetzelSpektrales Clustern (Folien)

Aufbau der Vorträge

Ein Vortrag besteht aus 3 Teilen:
  • Einführung in das Verfahren, Notation
  • Praktische Darstellung des Verfahrens an Beispielen (programmiert mit R; Basis-Quelltexte verfügbar)
  • Präsentation statistischer Aussagen und deren Beweisideen
Außerdem soll ein Handout mit den wichtigsten Notationen und Resultaten bereitgestellt werden.