Eine einfache graphische Darstellung des bivariaten Datensatzes
ist durch ein sogenanntes Streudiagramm gegeben, wobei
die Daten
als Punkte in der
euklidischen Ebene
aufgefasst und in ein (orthogonales)
kartesisches Koordinatensystem eingezeichnet werden, so dass
die -Werte auf der Abszissenachse und die -Werte auf der
Ordinatenachse aufgetragen werden.
Beispiel (vgl. Casella/Berger (2002) Statistical Inference,
Duxbury, S. 540 ff.)
Im Weinanbau werden die jeweils im Herbst geernteten Erträge in
Tonnen je 100 m (t/ar) gemessen.
Es ist bekannt, dass der Jahresertrag bereits im Juli ziemlich gut
prognostiziert werden kann, und zwar durch die Bestimmung der
mittleren Anzahl von Beeren, die je Traube gebildet worden sind.
Dabei fassen wir den Jahresertrag als Zielvariable () auf, und
die mittlere Clusterzahl je Traube () als Ausgangsvariable.
Beobachtet wurden die folgenden Ausprägungen/Werte:
Jahr
Ertrag ()
Clusterzahl ()
1971
5.6
116.37
1973
3.2
82.77
1974
4.5
110.68
1975
4.2
97.50
1976
5.2
115.88
1977
2.7
80.19
1978
4.8
125.24
1979
4.9
116.15
1980
4.7
117.36
1981
4.1
93.31
1982
4.4
107.46
1983
5.4
122.30
Die Daten des Jahres 1972 fehlen, weil in diesem Jahr das
untersuchte Weinanbaugebiet von einem Wirbelsturm verwüstet worden
war.
Für diesen Datensatz ergibt sich das folgende Streudiagramm: