# Angewandte Statistik (SoSe 2018) # @Unabhaengigkeit von Stichprobenmittel und -varianz sim <- 10000 # Simulationsdurchlaeufe n <- 10 # Stichprobengroesse mu <- 1 sigma <- 2 # wir bilden nun Paare von Mittelwerten und Varianzen A <- data.frame(MW=rep(0,sim), V=rep(0,sim)) # head(A) liefert uns z.B. die ersten Eintraege des data.frame A # str(A) gibt Informationen zur Struktur von A for (i in 1:sim) { STP <- rnorm(n, mu, sigma) # Erzeugung einer Stichprobe der Groesse n A$MW[i] <- mean(STP) # Mittelwert der ersten Spalte von A ist das STP-Mittel # mit dem Symbol $ kann man auf die Spalten in A zugreifen A$V[i] <- var(STP) # wir bilden die Varianz der zweiten Spalte von A } # Plotten der Verteilungsfunktionen des STP-Mittels und der STP-Varianz plot(ecdf(A$MW)) plot(ecdf(A$V*(n-1)/sigma^2)) # hinzufuegen der Verteilungsfunktion Chiquadrat-Verteilung (sollte ueberdecken) lines(seq(0,30,by=0.1), pchisq(seq(0,30,by=0.1),df=n-1), col = "red") # Funktion fuer die Verteilungsfunktion ec <- function(x,y,u,v){ # Vektoren x,y und Auswertungsstellen u,v erg <- mean((x<=u)*(y<=v)) return(erg) } u <- 1 v <- 1 ec(x=A$MW, y=A$V, u, v) ecdf(A$MW)(u)*ecdf(A$V)(v) # gemeinsame Verteilung dif <- rep(0,100) # Wir wollen nun mit der gemeinsamen Verteilung vergleichen: for (i in 1:100) { u <- runif(1,0,5) v <- runif(1,0,5) # Abstand der Verteilungen dif[i] <- abs(ec(x=A$MW, y=A$V, u, v) - ecdf(A$MW)(u)*ecdf(A$V)(v)) } boxplot(dif, horizontal = TRUE) hist(dif)