#Vorlesung Multivariate Analysen #=============================== # #Kapitel 1.5: T2-Statistik #==================================== # #Noten.rda #Darstellung des Streuungsdiagramms für Mathe und VWL require(car) dataEllipse(Noten$Mathe, Noten$VWL, levels=0.9545, pch=19, xlim=c(0,4.5),ylim=c(0,4.5)) # # #Berechnung der T2-Statistik für die zwei Variablen dat<-Noten[,c("Mathe","VWL")] n<-dim(dat)[1] m<-dim(dat)[2] mittel<-apply(dat,2,mean) datDiff <- as.matrix(dat - matrix(mittel, nrow = n, ncol = m, byrow = T)) T2 <- diag(datDiff %*% solve(var(dat)) %*% t(datDiff)) plot(T2,type="b") # # #Beispiel Körpergröße #Groesse dataEllipse(Groesse$Koerpergroesse, Groesse$Schuhgroesse, levels=c(0.9545,0.9973), pch=19,xlim=c(140,215),ylim=c(31,52)) # # #T2-Statistik mit Grenzen dat<-Groesse[,c("Koerpergroesse","Schuhgroesse")] n<-dim(dat)[1] m<-dim(dat)[2] mittel<-apply(dat,2,mean) datDiff <- as.matrix(dat - matrix(mittel, nrow = n, ncol = m, byrow = T)) T2 <- diag(datDiff %*% solve(var(dat)) %*% t(datDiff)) lim3s<-qf(0.9973,m,n-m)*(m*(n-1))/(n-m) lim2s<-qf(0.9545,m,n-m)*(m*(n-1))/(n-m) plot(T2,type="b",ylim=c(0,1.1*lim3s)) lines(c(0,n+1),c(lim3s,lim3s),type="l",col=2) lines(c(0,n+1),c(lim2s,lim2s),type="l",col=4) # # ###