next up previous contents
Nächste Seite: Transformation gleichverteilter Pseudozufallszahlen Aufwärts: Erzeugung von Pseudozufallszahlen Vorherige Seite: Lineare Kongruenzgeneratoren   Inhalt


Tests von Güteeigenschaften





  1. $ \chi ^2$-Anpassungstests auf Gleichverteilung

    Wir betrachten zunächst den folgenden Test, um zu prüfen, ob die Pseudozufallszahlen $ u_1,\ldots,u_n$

    Beachte
     
    • In Verallgemeinerung des bisher betrachteten $ \chi ^2$-Tests auf Gleichverteilung kann man auch prüfen,
      • ob für eine vorgegebene natürliche Zahl $ d\ge 1$ (beispielsweise $ d=2$ oder $ d=3$) die Pseudozufallsvektoren $ (u_1,\ldots,u_d),\ldots,(u_{(n-1)d+1},\ldots,u_{nd})$
      • als Realisierungen von unabhängigen Zufallsvektoren $ (U_1,\ldots,U_d),\ldots,(U_{(n-1)d+1},\ldots,U_{nd})$ angesehen werden können, die gleichverteilt in $ (0,1]^d$ sind.
    • Hierfür wird der Einheitswürfel $ (0,1]^d$
      • in $ r^d$ gleichgroße Teilwürfel $ B_j$ vom Typ $ ((i_1-1)/r,i_1/r]\times\ldots\times((i_d-1)/r,i_d/r]$ zerlegt und
      • der $ (r^d-1)$-dimensionale (hypothetische) Parametervektor $ {\mathbf{p}}_0=(1/r^d,\ldots,1/r^d)$ bzw.
      • die Testgröße $ T_n:\mathbb{R}^{nd}\to[0,\infty)$ mit

        $\displaystyle T_n({\mathbf{u}}_1,\ldots,{\mathbf{u}}_n)=\sum\limits
_{j=1}^{r^d}\;\frac{(Z_j({\mathbf{u}}_1,\ldots,{\mathbf{u}}_n)-n/r^d)^2}{n/r^d}
$

        betrachtet, wobei $ {\mathbf{u}}_i=(u_{(i-1)d+1},\ldots,u_{id})$ und $ Z_j({\mathbf{u}}_1,\ldots,{\mathbf{u}}_n)=\char93 \{i:\, 1\le i\le n,\, {\mathbf{u}}_i\in
B_j\}$ die Anzahl derjenigen Pseudozufallsvektoren $ {\mathbf{u}}_1,\ldots,{\mathbf{u}}_n$ bezeichnet, die in $ W_j$ liegen.


  2. Run-Test

    Zur Überprüfung der Güte von Zufallszahlengeneratoren gibt es noch weitere statistische Signifikanztests, durch die verifiziert werden kann,


    Der zu konstruierende Signifikanztest beruht auf der folgenden Eigenschaft der Runs $ W_1,W_2,\ldots$.

    Theorem 3.3   Die in % latex2html id marker 31133
$ (\ref{run1})$ eingeführten Zufallsvariablen $ W_1,W_2,\ldots$ sind unabhängig und identisch verteilt mit

    $\displaystyle P(W_j=k)=\frac{k}{(k+1)!}\,,\qquad\forall\, k=1,2,\ldots\,,$ (7)

    falls die Zufallsvariablen $ U_1,U_2,\ldots$ unabhängig und gleichverteilt im Intervall $ (0,1]$ sind.

    Beweis
     
    • Seien $ U_1,U_2,\ldots$ unabhängige und in $ (0,1]$ gleichverteilte Zufallsvariablen.
      • Für jedes $ n\ge 1$ und für beliebige natürliche Zahlen $ k_1,\ldots,k_n\ge 1$ gilt dann
        $\displaystyle { P(W_1=k_1,\ldots,W_n=k_n) =
P(V_1=k_1,V_2-V_1-1=k_2,\ldots,V_n-V_{n-1}-1=k_n)}$
          $\displaystyle =$ $\displaystyle P\bigl(V_1=k_1,V_2=k_2+k_1+1,\ldots,V_n=k_n+\ldots+k_1+n-1\bigr)$  
          $\displaystyle =$ $\displaystyle P\bigl(U_i\le
U_{i+1},\,\forall\,i=1,\ldots,k_1-1,\,U_{k_1}>U_{k_1+1},$  
            $\displaystyle U_i\le
U_{i+1},\,\forall\,i=k_1+2,\ldots,k_1+1+k_2-1,\,U_{k_1+1+k_2}>U_{k_1+1+k_2+1},\ldots,$  
            $\displaystyle U_i\le
U_{i+1},\,\forall\,i=k_1+1+\ldots+k_{n-1}+2,\ldots,k_1+1+\ldots+k_{n-1}+1+k_n-1,\,$  
            $\displaystyle \hspace{3cm}
U_{k_1+1+\ldots+k_{n-1}+1+k_n}>U_{k_1+1+\ldots+k_{n-1}+1+k_n+1}\bigr)$  
          $\displaystyle =$ $\displaystyle P\bigl(U_i\le
U_{i+1},\,\forall\,i=1,\ldots,k_1-1,\,U_{k_1}>U_{k_1+1}\bigr)$  
            $\displaystyle P\bigl(U_i\le
U_{i+1},\,\forall\,i=k_1+2,\ldots,k_1+1+k_2-1,\,U_{k_1+1+k_2}>U_{k_1+1+k_2+1}\bigr)$  
            $\displaystyle \ldots P\bigl(U_i\le
U_{i+1},\,\forall\,i=k_1+1+\ldots+k_{n-1}+2,\ldots,k_1+1+\ldots+k_{n-1}+1+k_n-1,\,$  
            $\displaystyle \hspace{3cm}
U_{k_1+1+\ldots+k_{n-1}+1+k_n}>U_{k_1+1+\ldots+k_{n-1}+1+k_n+1}\bigr)$  
          $\displaystyle =$ $\displaystyle P\bigl(U_i\le
U_{i+1},\,\forall\,i=1,\ldots,k_1-1,\,U_{k_1}>U_{k_1+1}\bigr)$  
            $\displaystyle \ldots P\bigl(U_i\le U_{i+1},\,\forall\,i=1,\ldots,k_n-1,\,
U_{k_n}>U_{k_n+1}\bigr)\,.$  

      • Hieraus folgt, dass die Runs $ W_1,W_2,\ldots$ unabhängig und identisch verteilt sind.
    • Außerdem ergibt sich mit vollständiger Induktion, dass für beliebige $ k\in\mathbb{R}$ und $ t\in(0,1]$

      $\displaystyle P(U_1\le\ldots\le U_k\le t)=\frac{t^k}{k!}\,.$ (8)

      • Für $ k=1$ ist (8) offenbar richtig, und aus der Formel der totalen Wahrscheinlichkeit ergibt sich, dass
        $\displaystyle P(U_1\le\ldots\le U_{k+1}\le t)$ $\displaystyle =$ $\displaystyle \int\limits_0^1
P(U_1\le\ldots\le U_k\le U_{k+1}\le t\mid
U_{k+1}=x)\,P(U_{k+1}\in\, dx)$  
          $\displaystyle =$ $\displaystyle \int\limits_0^1
P(U_1\le\ldots\le U_k\le x\le t\mid
U_{k+1}=x)\,P(U_{k+1}\in\, dx)$  
          $\displaystyle =$ $\displaystyle \int\limits_0^1
P(U_1\le\ldots\le U_k\le x\le t)\, dx\,,$  

        wobei sich letzte Gleichheit aus der Unabhängigkeit und $ (0,1]$-Gleichverteiltheit der $ U_1,U_2,\ldots$ ergibt.
      • Es gelte nun (8) für ein gewisses $ k\ge 1$. Dann gilt auch
        $\displaystyle P(U_1\le\ldots\le U_{k+1}\le t)$ $\displaystyle =$ $\displaystyle \int\limits_0^t
P(U_1\le\ldots\le U_k\le x)\, dx$  
          $\displaystyle =$ $\displaystyle \int\limits_0^t\;\frac{x^k}{k!}\,dx=\frac{t^{k+1}}{(k+1)!}\;,$  

        wobei sich die zweite Gleichheit aus der Induktionsannahme ergibt.
      • Damit ist die Gültigkeit von (8) für jedes $ k\ge 1$ bewiesen.
    • Aus (8) ergibt sich nun darüber hinaus, dass für jedes $ k\in\mathbb{N}$
      $\displaystyle P(U_1\le\ldots\le U_k,\,U_k> U_{k+1})$ $\displaystyle =$ $\displaystyle \int\limits_0^1
P(U_1\le\ldots\le U_k,\,U_k>x)\, dx$  
        $\displaystyle =$ $\displaystyle \int\limits_0^1 \Bigl(P(U_1\le\ldots\le U_k\le 1)-
P(U_1\le\ldots\le U_k\le x)\Bigr)\, dx$  
        $\displaystyle =$ $\displaystyle \int\limits_0^1\Bigl(\frac{1}{k!}\;-\;\frac{x^k}{k!}\Bigr)\,
dx$  
        $\displaystyle =$ $\displaystyle \frac{1}{k!}\;-\;\frac{1}{(k+1)!}=\frac{k}{(k+1)!}\;.$  


       
        $ \Box$


    Beachte
     
    • Es mögen nun hinreichend viele Pseudozufallszahlen $ u_1,u_2\ldots$ erzeugt werden, so dass sich aus ihnen gemäß (5) und (6) die $ n$ Runs $ w_1,\ldots,w_n$ ergeben.
    • Wir zerlegen die positive Halbachse in $ r$ Intervalle $ (a_1,b_1],\ldots,(a_r,b_r]$, so dass
      • die Wahrscheinlichkeiten

        $\displaystyle p_{0,j}=\sum\limits
_{k\in\mathbb{N}\cap(a_j,b_j]}\frac{k}{(k+1)!}\,,\qquad j=1,\ldots,r
$

        annähernd gleich sind, und
      • für diese Wahrscheinlichkeiten betrachten wir den $ (r-1)$-dimensionalen (hypothetischen) Vektor $ {\mathbf{p}}_0=(p_{0,1},\ldots,p_{0,r-1})$ bzw.
      • die Testgröße $ T_n:\mathbb{R}^n\to[0,\infty)$ mit

        $\displaystyle T_n(w_1,\ldots,w_n)=\sum\limits
_{j=1}^r\;\frac{(Y_j(w_1,\ldots,w_n)-np_{0,j})^2}{np_{0,j}}\;,
$

        wobei $ Y_j(w_1,\ldots,w_n)=\char93 \{i:\, 1\le i\le n,\, a_j<w_i\le
b_j\}$ die Anzahl derjenigen Runlängen $ w_1,\ldots,w_n$ bezeichnet, die in der $ j$-ten Klasse liegen.
    • Gemäß Theorem 3.3 wird nun bei großem $ n$, was die Erzeugung entsprechend vieler Pseudozufallszahlen $ u_1,u_2,\ldots$ erfordert, die Hypothese $ H_0:{\mathbf{p}}={\mathbf{p}}_0$ abgelehnt, falls $ T(w_1,\ldots,w_n)>\chi^2_{r-1,1-\alpha}$.



next up previous contents
Nächste Seite: Transformation gleichverteilter Pseudozufallszahlen Aufwärts: Erzeugung von Pseudozufallszahlen Vorherige Seite: Lineare Kongruenzgeneratoren   Inhalt
Ursa Pantle 2003-09-29