401-3632-00L  Computational Statistics

SemesterFrühjahrssemester 2015
DozierendeM. Mächler, P. L. Bühlmann
Periodizitätjährlich wiederkehrende Veranstaltung
LehrspracheEnglisch


Kurzbeschreibung"Computational Statistics" deals with modern methods of data analysis (aka "data science") for prediction and inference. An overview of existing methodology is provided and also by the exercises, the student is taught to choose among possible models and about their algorithms and to validate them using graphical methods and simulation based approaches.
LernzielGetting to know modern methods of data analysis for prediction and inference.
Learn to choose among possible models and about their algorithms.
Validate them using graphical methods and simulation based approaches.
InhaltDas Schliessen von beobachteten Daten auf komplexe Modelle ist ein zentrales Thema der rechnerorientierten Statistik. Die Modelle sind oft unendlich-dimensional und die statistischen Verfahren deshalb Computer-intensiv.
Als Grundlage wird die klassische multiple Regression eingeführt. Danach werden einige nichtparametrische Verfahren für die Regression und die Klassifikation vorgestellt: Kernschätzer, glättende Splines, Regressions-/Klassifikationsbäume, additive Modelle, Projection Pursuit und evtl. Neuronale Netze, wobei einige davon gut interpretierbar und andere für genaue Prognosen geeignet sind. Insbesondere werden auch die Problematik des Fluchs der Dimension und die stochastische Regularisierung diskutiert. Nebst dem Anpassen eines (komplexen) Modells werden auch die Evaluation, Güte und Unsicherheit von Verfahren und Modellen anhand von Resampling, Bootstrap und Kreuz-Validierung behandelt.

In den Übungen wird mit dem Statistik-Paket R (http://www.R-project.org) gearbeitet. Es werden dabei auch praxis-bezogene Probleme bearbeitet.
Skriptlecture notes are available online; see
http://stat.ethz.ch/education/ (-> "Computational Statistics").
Literatur(see the link above, and the lecture notes)
Voraussetzungen / BesonderesBasic "applied" mathematical calculus and linear algebra.
At least one semester of (basic) probability and statistics.