In diesem Abschnitt setzen wir erneut voraus, dass der Parameter
eine relle Zahl ist, d.h., es gelte bzw.
.
Definition
Sei
eine Stichprobenfunktion, so dass
für jedes
und
Falls für jede Stichprobenfunktion
mit
die Ungleichung
gilt, dann heißt
bester
erwartungstreuer Schätzer für .
Beachte
Bevor wir zeigen, welche erwartungstreuen Schätzer beste
erwartungstreue Schätzer sind, diskutieren wir zunächst einige
grundlegende Eigenschaften solcher Schätzer.
Als erstes zeigen wir den folgenden Eindeutigkeitssatz für
beste erwartungstreue Schätzer.
Lemma 2.6
Es gibt höchstens einen besten erwartungstreuen Schätzer für
, d.h., falls
ein bester
erwartungstreuer Schätzer für ist, dann ist
mit Wahrscheinlichkeit eindeutig
bestimmt.
Beweis
Wir führen einen indirekten Beweis und nehmen an, dass
ein bester erwartungstreuer Schätzer
für ist und dass es noch einen weiteren besten
erwartungstreuen Schätzer
für
gibt.
Dann ist auch
ein erwartungstreuer Schätzer für , und es gilt
wobei in der letzten Gleichheit die Annahme genutzt wurde, dass
Hieraus folgt, dass die Ungleichung in dieser Rechnung eine
Gleichheit sein muss, weil ansonsten
nicht bester erwartungstreuer Schätzer für wäre.
Mit anderen Worten: Der Korrelationskoeffizient von
und
ist
gleich .
Wegen Theorem WR-4.12 gibt es somit Zahlen
, so dass mit Wahrscheinlichkeit
Aus den Rechenregeln für die Kovarianz (vgl. Theorem WR-4.11)
ergibt sich nun, dass
Weil wir andererseits gezeigt hatten, dass
folgt somit, dass
.
Wegen
ergibt sich hieraus, dass
bzw.
Beachte
Wir leiten nun ein Kriterium dafür her, dass ein erwartungstreuer
Schätzer für gleichzeitig bester erwartungstreuer
Schätzer ist.
Das ist zunächst ein formales (d.h. nicht direkt nachprüfbares)
Kriterium, welches jedoch bei der Herleitung des Hauptergebnisses
dieses Abschnittes in Theorem 2.5 bzw. bei dessen
Verallgemeinerung in Theorem 2.6 sehr nützlich ist.
Hierfür benötigen wir noch den folgenden Begriff.
Definition
Sei
eine beliebige
Stichprobenfunktion mit
für
jedes
. Falls
für jedes
,
dann sagen wir, dass
ein
erwartungstreuer Schätzer für 0 ist.
Lemma 2.7
Sei
ein erwartungstreuer Schätzer für
mit
Dann ist
genau dann bester
erwartungstreuer Schätzer für , wenn
unkorreliert ist mit jedem
erwartungstreuen Schätzer für 0.
Beweis
Sei
bester erwartungstreuer
Schätzer für , und sei
ein
erwartungstreuer Schätzer für 0.
Für jedes
ist dann auch
ein erwartungstreuer Schätzer für , und es gilt
Wir führen einen indirekten Beweis und nehmen an, dass es ein
gibt, so dass
Dann gibt es ein
, so dass
Hieraus folgt, dass
was im Widerspruch zu der Annahme steht, dass
bester erwartungstreuer Schätzer
für ist.
Also ist
(50)
Damit ist die Notwendigkeit der Bedingung (50)
bweisen.
Es gelte nun (50) für jeden erwartungstreuen
Schätzer
für 0.
Sei
ein anderer erwartungstreuer
Schätzer für mit
Wegen der Identität
ergibt sich aus Theorem WR-4.13, dass
wobei sich die letzte Gleichheit aus (50) ergibt,
weil
ein
erwartungstreuer Schätzer
für 0 ist.
Weil
ergibt sich nun, dass
d.h.,
ist bester erwartungstreuer
Schätzer für .
Mit Hilfe von Lemma 2.7 lässt sich nun das folgende
Ergebnis herleiten, das in der Literatur Satz von
Lehmann-Scheffé genannt wird.
Sei
ein beliebiges
parametrisches Modell mit
, und sei
eine beliebige Stichprobenfunktion,
so dass
ein vollständiger und
suffizienter Schätzer für ist.
Falls
erwartungstreu für
ist und falls
dann ist
bester erwartungstreuer
Schätzer für .
Beweis
Sei
ein vollständiger und
suffizienter Schätzer für , der erwartungstreu für
ist und dessen Varianz für jedes
endlich ist.
Wegen Lemma 2.7 genügt es zu zeigen, dass
unkorreliert ist mit jedem
erwartungstreuen Schätzer
für 0.
Hierfür genügt es zu zeigen, dass
(51)
weil
für jedes
.
Wir benutzen die folgende Formel der totalen Wahrscheinlichkeit:
die sich unmittelbar aus Theorem WR-2.6 ergibt, falls
eine diskrete Zufallsvariable ist
(ansonsten kann man die Gültigkeit dieser Formel mittels
Grenzwertbildung so wie in (45) erklären).
Hieraus folgt, dass
wobei
den Erwartungswert der (bedingten) Verteilung
bezeichnet mit
Weil
suffizient ist, hängt
lediglich von , jedoch nicht von ab, d.h., es gibt
eine (messbare) Funktion
, so dass
Somit gilt
d.h.
.
Hieraus ergibt sich die Gültigkeit von (51), denn
aus der Formel der totalen Wahrscheinlichkeit folgt, dass