Projekt mit dem Forschungsdatenzentrum des Hessischen Statistischen Landesamtes

Beschreibung

Lehre und Forschung in Statistik lebt vom Bezug zu realen Daten. Leider ist dieser innerhalb von Universitäten nicht sehr ausgeprägt, weshalb oft nur sehr wenige reale Datensätze zur Illustration von statistischen Verfahren eingesetzt werden. Das Ziel dieses gemeinsamen Projektes mit dem Hessischen Statistischen Landesamt ist es, hier Abhilfe zu schaffen.

Das erste Teilziel des Projektes ist die Erstellung von Skripten in der Statistik-Software R, welche anhand von realen Daten (Mikrozensus 2002) verschiedene Schätzverfahren illustrieren sollen. Es handelt sich hierbei einerseits um Verfahren zur Dichte- und andererseits um Verfahren der Regressionsschätzung. Das Teilprojekt ist abgeschlossen, die Skripte können auf unserem R-Webserver direkt ausgeführt werden.

Beim zweiten Teil des Projektes sollen gängigen Verfahren der multivariaten nichtparametrischen Regression verglichen werden. Dazu werden aus dem Datenpool des Hessischen Statistischen Landesamtes Datensätze ausgewählt, die im Hinblick auf Fragestellungen aus der Regressionsschätzung interessant erscheinen. Die Daten werden dann vom Hessischen Statistischen Landesamt ensprechend aufbereitet bzw. anonymisiert. Anschließend sollen die verschiedenen Verfahren (z.B. lokale Durchschnittsbildung, Kleinste-Quadrate-Splineschätzer etc.) auf die Daten angewandt werden, mit entsprechender Fehlerauswertung.

Es handelt sich hierbei um ein Pilotprojekt, dass langfristig innerhalb der mathematischen Statistik einen ähnlichen Benchmark ergeben soll wie es ihn heute schon für Verfahren des maschinellen Lernens innerhalb der Informatik gibt. Die Datensätze stehen man am Seitenende zum Download bereit. Die Ergebnisse folgen im Rahmen eines wissenschaftlichen Artikels.

Downloads

  • Datasets Regression.zipIn der Zip-Datei befinden sich 10 verschieden Datensätze, jeweils aufgeteilt in Trainings- und Evaluationsdaten. So wird die Vergleichbarkeit der Verfahren gewährleistet.0.9 M

Kontakt

Prof. Dr. Michael Kohler (kohler[at][Fachbereich].[Hochschule].de)

Dr. Daniel Jones (jones[at][Fachbereich].[Hochschule].de)

A A A | Print Drucken | Impressum Impressum | Contact Kontakt
    zum Seitenanfangzum Seitenanfang