Next: Gewinnung von experimentellen Daten
Up: Methoden der Datengewinnung
Previous: Klassifikation von Merkmalen/Kenngrößen/Variablen
  Contents
Datenerhebung
Wenn die Gewinnung von Daten durch die Beobachtung/Registrierung
interessierender Merkmale/Kenngrößen/ Variablen von realen
Sachverhalten, Objekten bzw. Vorgängen (durch direkte Messung,
Inventur, Befragung, etc.) erfolgt, dann spricht man von
Datenerhebung. Dabei gibt es verschiedene Arten der
Datenerhebung.
- Primär- und sekundärstatistische Erhebung
- Man spricht von primärstatistischer Erhebung, wenn die Daten
speziell im Zusammenhang mit der interessierenden Fragestellung
erhoben werden, bzw. von
- sekundärstatistischer Erhebung, wenn die Daten bereits
vorhanden sind und beispielsweise lediglich aus größeren
Datenbeständen/Datenbanken extrahiert werden müssen.
- Beachte:
- Wenn nicht die Rohdaten selbst, sondern nur vorverarbeitete
(beispielsweise aggregierte/komprimierte) Daten vorliegen, dann
spricht man von tertiärstatistischer Datenerhebung.
- In der Regel sind Rohdaten besser als stark
aggregierte/komprimierte Daten für statistische Analysen
geeignet.
- Fehlende Daten
- Durch das Zusammenfassen, d.h. das Aggregieren bzw. Komprimieren
von Daten entsteht stets ein Informationsverlust.
- Ein ähnliches Problem sind fehlende Daten. Dieser Effekt
tritt häufig bei der Befragung von Personen auf und kann die
Ergebnisse statistischer Analysen negativ beeinflussen.
- Ein anderes Beispiel, bei dem die Problematik fehlender Daten
typischerweise vorkommt, ist die statistische Bildanalyse. Denn
die Daten, die den Rand von digitalen Bildern beschreiben, sind
oft weniger informativ als die Daten, die den inneren Bildbereich
beschreiben.
- Wenn der Entstehungsmechanismus bekannt ist, der zum Fehlen von
Daten führt, dann kann dies allerdings durch eine entsprechende
Wahl der statistischen Analyse-Methoden korrigiert werden.
- Zum Beispiel werden bei der Analyse von Bilddaten sogenannte
randkorrigierte Schätzer betrachtet.
- Teil- und Vollerhebung
- Häufig wird die Beobachtung interessierender
Merkmale/Kenngrößen/Variablen lediglich für einen Teil der
(insgesamt verfügbaren) realen Sachverhalte, Objekte bzw. Vorgänge
durchgeführt.
- Man spricht dann vom Ziehen einer Stichprobe aus der
insgesamt (zumindest prinzipiell) verfügbaren Grundgesamtheit von
Sachverhalten/Objekten/Vorgängen bzw. von einer
Teilerhebung.
- Manchmal (beispielsweise bei Volkszählungen) werden die
interessierenden Merkmale/Kenngrößen/ Variablen jedoch für
sämtliche Einheiten der Grundgesamtheit beobachtet/registriert. In
diesem Fall spricht man von einer Vollerhebung.
- Ein typisches Beispiel für Teilerhebungen ist die
Qualitätskontrolle von Produkten, bei der eine Vollerhebung
häufig aus Kostengründen bzw. wegen des hohen zeitlichen Auswandes
nicht sinnvoll ist.
Next: Gewinnung von experimentellen Daten
Up: Methoden der Datengewinnung
Previous: Klassifikation von Merkmalen/Kenngrößen/Variablen
  Contents
Andreas Narr
2004-07-12