next up previous contents
Nächste Seite: Vollständigkeit Aufwärts: Güteeigenschaften von Punktschätzern Vorherige Seite: Ungleichung von Cramér-Rao   Inhalt


Suffizienz

Sei % latex2html id marker 27727
$ \{P_\theta,\,\theta\in\Theta\}$ ein beliebiges parametrisches Modell mit % latex2html id marker 27729
$ \Theta\subset\mathbb{R}^m$, und sei $ (X_1,\ldots,X_n)$ eine Zufallsstichprobe über dem (kanonischen) Wahrscheinlichkeitsraum $ (\Omega,\mathcal{F},P_\theta)$.
Beachte
 
Wir präzisieren dies zunächst für den diskreten Fall: Für jedes % latex2html id marker 27754
$ \theta\in\Theta$ gelte
Definition
$ \;$ Der Schätzer $ \varphi(X_1,\ldots,X_n)$ für $ \theta$ heißt suffizient, falls für beliebige $ x_1,\ldots,x_n\in C$ und $ t\in C^\prime$ die bedingten Wahrscheinlichkeiten

$\displaystyle P_\theta(X_1=x_1,\ldots,X_n=x_n\mid\varphi(X_1,\ldots,X_n)=t)=
 \...
...dots,X_n=x_n,\varphi(X_1,\ldots,X_n)=t)}{
 P_\theta(\varphi(X_1,\ldots,X_n)=t)}$ (42)

nicht von $ \theta$ abhängen.


Beachte
 
Zunächst zeigen wir, dass die Suffizienz bei (bijektiven) zusammengesetzten Stichprobenfunktionen nicht verloren geht.

Lemma 2.1   Sei $ \varphi(X_1,\ldots,X_n)$ ein suffizienter Schätzer für $ \theta$, und sei $ g:\mathbb{R}^m\to\mathbb{R}^m$ eine bijektive Borel-messbare Abbildung. Dann ist auch $ g\circ\varphi(X_1,\ldots,X_n)$ ein suffizienter Schätzer für $ \theta$.

Beweis
  Für jedes $ t\in\mathbb{R}^m$ mit $ P_\theta(g\circ\varphi(X_1,\ldots,X_n)=t)>0$ gilt
$\displaystyle {
P_\theta(X_1=x_1,\ldots,X_n=x_n\mid g\circ\varphi(X_1,\ldots,X_n)=t)}$
  $\displaystyle =$ $\displaystyle \frac{P_\theta(X_1=x_1,\ldots,X_n=x_n,g\circ\varphi(X_1,\ldots,X_n)=t)}{
P_\theta(g\circ\varphi(X_1,\ldots,X_n)=t)}$  
  $\displaystyle =$ $\displaystyle \frac{P_\theta(X_1=x_1,\ldots,X_n=x_n,\varphi(X_1,\ldots,X_n)=g^{-1}(t))}{
P_\theta(\varphi(X_1,\ldots,X_n)=g^{-1}(t))}$  
  $\displaystyle =$ $\displaystyle P_\theta(X_1=x_1,\ldots,X_n=x_n\mid\varphi(X_1,\ldots,X_n)=g^{-1}(t))\;,$  

wobei der letzte Ausdruck nicht von $ \theta$ abhängt, weil $ \varphi(X_1,\ldots,X_n)$ suffizient ist.

$ \Box$
Beachte
 

Lemma 2.2   Der Schätzer $ \varphi(X_1,\ldots,X_n)$ für $ \theta$ ist genau dann suffizient, wenn für beliebige $ x_1,\ldots,x_n\in C$ der Quotient $ p(x_1,\ldots,x_n;\theta)/q( \varphi(x_1,\ldots,x_n);\theta)$ nicht von % latex2html id marker 27868
$ \theta\in\Theta$ abhängt.

Beweis
 
Beispiel
$ \;$ Bernoulli-verteilte Stichprobenvariablen


Beachte
 

Theorem 2.3   Der Schätzer $ \varphi(X_1,\ldots,X_n)$ für $ \theta$ ist genau dann suffizient, wenn es Borel-messbare Funktionen % latex2html id marker 27949
$ g:\mathbb{R}^m\times\Theta\to\mathbb{R}$ und $ h:\mathbb{R}^n\to\mathbb{R}$ gibt, so dass

% latex2html id marker 27953
$\displaystyle p(x_1,\ldots,x_n;\theta)=g\bigl(\var...
...1,\ldots,x_n)\,,\qquad\forall\,x_1,\ldots,x_n\in\mathbb{R},\,\theta\in\Theta\,.$ (43)


Beweis
 
Beispiel
$ \;$ Poissonverteilte Stichprobenvariablen


Wir betrachten nun den absolutstetigen Fall, d.h.,


Definition
$ \;$ Der Schätzer $ \varphi(X_1,\ldots,X_n)$ für $ \theta$ heißt suffizient, falls für beliebige $ B\in\mathcal{B}(\mathbb{R}^n)$ und $ t\in\mathbb{R}^m$ die bedingte Wahrscheinlichkeit $ P_\theta\bigl((X_1,\ldots,X_n)\in B
\mid\varphi(X_1,\ldots,X_n)=t\bigr)$ nicht von $ \theta$ abhängt.


Beachte
 


Lemma 2.3   Sei $ f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;\theta)$ die Dichte der Zufallsstichprobe $ (X_1,\ldots,X_n)$, und $ f_{\varphi(X_1,\ldots,X_n)}(t;\theta)$ sei die Dichte von $ \varphi(X_1,\ldots,X_n)$. Falls für beliebige $ x_1,\ldots,x_n\in
\mathbb{R}$ mit

$\displaystyle f_{\varphi(X_1,\ldots,X_n)}( \varphi(x_1,\ldots,x_n);\theta)>0$ (46)

der Quotient $ f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;\theta)/f_{\varphi(X_1,\ldots,X_n)}(
\varphi(x_1,\ldots,x_n);\theta)$ nicht von % latex2html id marker 28084
$ \theta\in\Theta$ abhängt, dann ist durch $ \varphi(X_1,\ldots,X_n)$ ein suffizienter Schätzer für $ \theta$ gegeben.


Beweis
 


Beispiele
 
  1. $ \;$ Normalverteilte Stichprobenvariablen
    • Es gelte % latex2html id marker 28125
$ \{P_\theta,\,\theta\in\Theta\}=\{$N $ (\mu,\sigma^2),\,\mu\in\mathbb{R}\}$, wobei die Varianz $ \sigma^2>0$ bekannt sei.
    • Wir zeigen, dass $ \overline X_n$ ein suffizienter Schätzer für $ \mu$ ist.
    • Für die gemeinsame Dichte $ f_{(X_1,\ldots,X_n)}$ der Zufallsstichprobe $ (X_1,\ldots,X_n)$ gilt
      $\displaystyle f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;\mu)$ $\displaystyle =$ $\displaystyle \prod\limits_{i=1}^n\frac{1}{\sqrt{2\pi}\sigma}
\exp\Bigl(-\,\frac{(x_i-\mu)^2}{2\sigma^2}\Bigr)$  
        $\displaystyle =$ $\displaystyle \frac{1}{(2\pi\sigma^2)^{n/2}}
\exp\Bigl(-\,\sum\limits_{i=1}^n\frac{(x_i-\mu)^2}{2\sigma^2}\Bigr)$  
        $\displaystyle =$ $\displaystyle \frac{1}{(2\pi\sigma^2)^{n/2}}
\exp\Bigl(-\,\sum\limits_{i=1}^n\frac{(x_i-\overline x_n+\overline
x_n-\mu)^2}{2\sigma^2}\Bigr)$  
        $\displaystyle =$ $\displaystyle \frac{1}{(2\pi\sigma^2)^{n/2}}
\exp\Bigl(-\,\sum\limits_{i=1}^n\f...
...\overline
x_n)^2}{2\sigma^2} -\frac{n(\overline
x_n-\mu)^2}{2\sigma^2}\Bigr)\,,$  

      wobei in der letzten Gleichheit die Tatsache genutzt wurde, dass

      $\displaystyle \sum\limits_{i=1}^n(x_i-\overline x_n)(\overline
x_n-\mu)=(\overline x_n-\mu)\sum\limits_{i=1}^n(x_i-\overline
x_n)=0\,.
$

    • Weil $ \overline X_n\sim$ N $ (\mu,\sigma^2/n)$, gilt somit
      $\displaystyle \frac{f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;\mu)}{f_{\overline X_n}(
\overline x_n;\mu)}$ $\displaystyle =$ $\displaystyle \frac{\displaystyle\frac{1}{(2\pi\sigma^2)^{n/2}}
\exp\Bigl(-\,\s...
...\pi\sigma^2/n)^{1/2}}\exp\Bigl(\frac{-n(\overline
x_n-\mu)^2}{2\sigma^2}\Bigr)}$  
        $\displaystyle =$ $\displaystyle \frac{1}{\sqrt{n}(2\pi\sigma^2)^{(n-1)/2}}
\exp\Bigl(-\,\sum\limits_{i=1}^n\frac{(x_i-\overline
x_n)^2}{2\sigma^2}\Bigr)\,,$  

      wobei der letzte Ausdruck nicht von $ \mu$ abhängt.
    • Aus Lemma 2.3 ergibt sich nun, dass $ \overline X_n$ ein suffizienter Schätzer für $ \mu$ ist.
  2. $ \;$ Exponentialverteilte Stichprobenvariablen
    • Es gelte % latex2html id marker 28183
$ \{P_\theta,\,\theta\in\Theta\}=\{$Exp $ (\lambda),\,\lambda>0\}$.
    • Wir zeigen zunächst, dass $ Y=X_1+\ldots+X_n$ ein suffizienter Schätzer für $ \lambda$ ist.
    • Für die gemeinsame Dichte $ f_{(X_1,\ldots,X_n)}$ der Zufallsstichprobe $ (X_1,\ldots,X_n)$ gilt

      $\displaystyle f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;\lambda)=\lambda^n\exp\Bigl(-\lambda\sum\limits_{i=1}^n
x_i\Bigr)\,.
$

    • Weil $ Y$ Erlang-verteilt ist mit der Dichte

      $\displaystyle f_Y(y;\lambda)=\frac{\lambda^ny^{n-1}e^{-\lambda
y}}{(n-1)!}\,,\qquad\forall\, y>0\,,
$

      ergibt sich somit, dass
      $\displaystyle \frac{f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;\lambda)}{f_Y(
x_1+\ldots+x_n;\lambda)}$ $\displaystyle =$ $\displaystyle \frac{\lambda^n e^{
-\lambda(x_1+\ldots+x_n)}
}{\displaystyle\frac{\lambda^n(x_1+\ldots+x_n)^{n-1}e^{-\lambda
(x_1+\ldots+x_n)}}{(n-1)!}}$  
        $\displaystyle =$ $\displaystyle \frac{(n-1)!}{(x_1+\ldots+x_n)^{n-1}}\;.$  

    • Aus Lemma 2.3 ergibt sich nun, dass $ Y$ ein suffizienter Schätzer für $ \lambda$ ist.
    • Mit einer ähnlichen Überlegung wie im Beweis von Lemma 2.1 kann man auch im absolutstetigen Fall zeigen, dass $ g\circ\varphi(X_1,\ldots,X_n)$ ein suffizienter Schätzer für $ \theta$ ist, falls $ \varphi(X_1,\ldots,X_n)$ diese Eigenschaft besitzt und $ g:\mathbb{R}^m\to\mathbb{R}^m$ eine bijektive Borel-messbare Abbildung ist.
    • Hieraus ergibt sich, dass auch $ n/Y$ ein suffizienter Schätzer für $ \lambda$ ist, für den außerdem

      $\displaystyle n/Y\stackrel{{\rm f.s.}}{\longrightarrow}\lambda
$

      für $ n\to\infty$ (wegen des starken Gesetzes der großen Zahlen) gilt; vgl. auch Abschnitt 2.4.1.


Beachte
 

Theorem 2.4   Der Schätzer $ \varphi(X_1,\ldots,X_n)$ für $ \theta$ ist genau dann suffizient, wenn es Borel-messbare Funktionen % latex2html id marker 28239
$ g:\mathbb{R}^m\times\Theta\to\mathbb{R}$ und $ h:\mathbb{R}^n\to\mathbb{R}$ gibt, so dass

% latex2html id marker 28243
$\displaystyle f_{(X_1,\ldots,X_n)}(x_1,\ldots,x_n;...
...\ldots,x_n)\,,\qquad\forall\,x_1,\ldots,x_n\in\mathbb{R},\,\theta\in\Theta\,.
$

Der Beweis von Theorem 2.4 geht über den Rahmen dieser einführenden Vorlesung hinaus; vgl. beispielsweise Abschnitt 3.3 in H. Pruscha (2000) Vorlesungen über Mathematische Statistik, Teubner-Verlag, Stuttgart, oder Abschnitt 2.6 in E.L. Lehmann (1997) Testing Statistical Hypotheses, 2nd ed., Springer-Verlag, New York.


Beispiel
$ \;$ Normalverteilte Stichprobenvariablen (Fortsetzung)

next up previous contents
Nächste Seite: Vollständigkeit Aufwärts: Güteeigenschaften von Punktschätzern Vorherige Seite: Ungleichung von Cramér-Rao   Inhalt
Ursa Pantle 2004-07-14