Heidelberg University

Regressionsanalyse und hochdimensionale Daten

Wintersemester 2020/2021


Organisation

Dozenten:

Seminar

  • Zeit: An Dienstagen, in Blöcken, 14 - 18 Uhr
  • Ort: Mathematikon, Seminarraum ???
     (derzeit ist wegen der Corona-Situation noch unklar, in welcher Form das Seminar stattfindet).

Deadline für Anmeldungen

Freitag, 23.10.2020, 23:59 Uhr. Die Anmeldung erfolgt per Mail an Stefan Richter. Bitte vermerken Sie, ob Sie im Anschluss an das Seminar eine Bachelorarbeit bei uns schreiben möchten, und ob Sie das Seminar als Masterseminar angerechnet haben möchten (s.u.).

Seminar-Klassifizierung

Das Seminar ist ein Bachelor-Seminar im Bereich Angewandte Mathematik. Falls es noch freie Pltze gibt, ist auch die Anrechnung als Masterseminar bei Erhöhung des Schwierigkeitsgrads des Themas möglich.
Leistungspunkte: 6 LP

Vorwissen

  • Vorlesungen in Wahrscheinlichkeitstheorie und Statistik (insbes. Einführung in die Wahrscheinlichkeitstheorie und Statistik, Wahrscheinlichkeitstheorie 1).
  • Sichere Kenntnisse in Linearer Algebra (Eigenwerte, Inverse, Normen, Orthogonalität)
  • Kenntnisse in der Programmiersprache R sind erwünscht, aber nicht Voraussetzung

Inhalt

Das Seminar orientiert sich an den Büchern
  • Christophe Giraud: Introduction to High-Dimensional Statistics, Chapmann and Hall (Taylor and Francis) 2015
  • Peter Bühlmann, Sara van de Geer: Statistics for high-dimensional data, Springer 2011
  • Sara van de Geer: Estimation and testing under sparsity, Springer 2016
sowie ausgewählten dazu passenden wissenschaftlichen Publikationen. Wesentliches Thema ist der Lasso-Schätzer in linearen Modellen und darauf aufbauende Erweiterungen und statistische Verbesserungen.

Die meisten Vorträge sind thematisch unabhängig voneinander.

Themen:

Die Themenliste mit Zeitplan ist hier verfügbar.

Material:

Das Material für die einzelnen Vorträge ist hier verfügbar.

Aufbau der Vorträge

Ein Vortrag besteht aus 3 Teilen:
  • Beschreibung des Modells und des Schätzverfahrens
  • Präsentation statistischer Aussagen und deren Beweisideen
  • Sofern möglich: Präsentation der Verfahren anhand von Beispielen (programmiert mit R)
Außerdem soll ein Handout mit den wichtigsten Notationen und Resultaten bereitgestellt werden.