Datenanalysen sind numerische und statistische Verfahren mit dem Ziel, zum Beurteilen der Lage und zur Entscheidungsfindung systematisch Strukturen, Abhängigkeiten und Zusammenhänge in großen, erhobenen Datenmengen aufzudecken, zu verdichten, und dann tabellarisch oder graphisch zu dokumentieren. Die Datenanalyse hat vorrangig zum Ziel, bereits vorhandene Daten genau kennen zu lernen, sie aufzuarbeiten und verständlich darzustellen. Danach sollen aus den vorhandenen Daten Fragestellungen und Hypothesen entwickelt werden.
Man unterscheidet verschiedene Formen der Datenanalyse:
- Die deskriptive Datenanalyse wird angewandt, wenn eine Totalerhebung oder ganz allgemein ein Datensatz vorliegt. Sie wird eingesetzt, um Informationen aus Einzeldaten so herauszufiltern und zu verdichten, dass wesentliche Strukturen deutlich werden. Diese werden dann in Tabellen und Grafiken bildlich und beschreibend dargestellt.
- Die inferenzielle Datenanalyse schließt von einer Stichprobenerhebung (Teilerhebung) auf die Grundgesamtheit auf der Basis eines statistischen Modells. In der so genannten Inferenzstatistik sind die bekanntesten Testverfahren die Punktschätzung, die Intervallschätzung sowie die Hypothesenprüfung.
- Eine explorative Datenanalyse wird eingesetzt, um in einer vorhandenen Datenmenge Strukturen oder einfache und überschaubare Zusammenhänge zwischen verschiedenen Variablen sichtbar zu machen oder überhaupt erst aufzudecken.
- Die konfirmatorische Datenanalyse hat schließlich im Gegensatz zur explorativen die Überprüfung von Zusammenhängen zum Ziel.
Ganz allgemein wird außerdem von einer uni-, bi- oder multivarianten Datenanalyse gesprochen, je nachdem, ob bei der Untersuchung eine einzige Variable, oder die Beziehung zwischen zwei oder mehreren Variablen, untersucht wird.