#Vorlesung "Statistische Methoden" #================================= #Kapitel 2.1 #=========== # # #Laden der Daten über Menü: Datenmanagement/Lade Datendatei ... load("C:/.../Unternehmen.rda") # # #Auswertung des Merkmals "Branche" #================================= # #absolute Häufigkeiten hi dat<-Unternehmen$Branche hTabelle<-table(dat) hTabelle #relative Häufigkeiten fi fTabelle<-hTabelle/sum(hTabelle) fTabelle # #Grafische Darstellung der Häufigkeiten #Stabdiagramm plot(hTabelle) #mit Beschriftung der Achsen für relative Häufigkeiten plot(fTabelle, xlab="Branche", ylab="Häufigkeit") #Balkendiagramm barplot(hTabelle) #Kuchendiagramm pie(hTabelle, main="Kuchendiagramm") # # #Auswertung des Merkmals "Umsatz" #================================ # #Häufigkeitstabelle und Stabdiagramm dat<-Unternehmen$Umsatz hTabelle<-table(dat) fTabelle<-hTabelle/sum(hTabelle) plot(fTabelle) # #Ordinalskaliertes Merkmal wird im Bsp durch Klassenmitte ersetzt #Befehl: Datenmanagement/Variablen bearbeiten/Recodiere Variablen #(Bei Problemen: Neustart von R) Unternehmen$UmsatzMittel <- recode(Unternehmen$Umsatz, '"A"=500; "B"=3000; "C"=7500; "D"=15000; "E"=35000; ', as.factor.result=FALSE) #Häufigkeitstabelle und Stabdiagramm dat<-Unternehmen$UmsatzMittel plot(table(dat)/sum(table(dat)),xlim=c(0,50000)) #Vgl. Klassierte Daten # # #Auswertung des Merkmals "Standorte" #=================================== # #Häufigkeiten dat<-Unternehmen$Standorte hTabelle<-table(dat) fTabelle<-hTabelle/sum(hTabelle) plot(fTabelle) # #Zusammenfassung zu Klassen über Histogrammfunktion histTabelle<-hist(dat) # #Klassengrenzen selbst festlegen hTabelle<-table(cut(Unternehmen$Standorte,breaks=c(0,3,6,9,12,15,18))) fTabelle<-hTabelle/sum(hTabelle) barplot(fTabelle,space=0) # #Empirische Verteilungsfunktion plot.ecdf(dat) hTabelle<-table(dat) fTabelle<-hTabelle/sum(hTabelle) plot(as.table(cumsum(fTabelle)),type="b") # # #Lageparameter (Standorte) #========================= # dat<-Unternehmen$Standorte # #Median median(dat) # #arithmetisches Mittel mean(dat) # #Quantile quantile(dat) # #Zusammenfassung summary(dat) # # #Streuungsmaße (Standorte) #========================= # dat<-Unternehmen$Standorte # #Spannweite max(dat)-min(dat) # #Mittlere Abweichung n<-length(dat) sum(abs(dat-mean(dat)))/n # #Varianz - Korrektur für beschreibende Statistik var(dat)*(n-1)/n # #Standardabweichung - beschreibende Statistik sqrt(var(dat)*(n-1)/n) # #Variationskoeffizient sqrt(var(dat)*(n-1)/n)/mean(dat) # # #Geometrisches Mittel #==================== # dat<-c(1.05,1.07,1.04,1.02,1.01,1.08,1.06,1.04,1.05,1.06) # #Durchschnittszins (arith. Mittel) n<-length(dat) sum(dat)/n # #Durchschnittswachstum (geom. Mittel) prod(dat)^(1/n) # # #Harmonisches Mittel #=================== # #Durchschnittlicher Einstandspreis (harm. Mittel) # dat<-c(0.5,1,1.5) # n<-length(dat) n/sum(1/dat) # # #Spezialfall "klassierte Daten" (UmsatzMittel) #============================================= # dat<-Unternehmen$UmsatzMittel # #Darstellung des Histograms inklusive Berechnungen erg<-hist(dat,breaks=c(0,1000,5000,10000,20000,50000)) # #Klassenbreite diff(erg$breaks) # #Klassenmitte erg$mids # #Normierte relative Häufigkeit erg$density # #Verteilungsfunktion fVert<-cumsum(table(dat)/sum(table(dat))) # #Darstellung der Verteilungsfunktion plot(as.table(fVert),type="b") # #Mittelwert mean(dat) # #Keine Funktionen für weitere Berechnungen bei klassierten Daten #