#Vorlesung "Statistische Methoden"
#=================================
#Kapitel 2.1
#===========
#
#
#Laden der Daten über Menü: Datenmanagement/Lade Datendatei ...
load("C:/.../Unternehmen.rda")
#
#
#Auswertung des Merkmals "Branche"
#=================================
#
#absolute Häufigkeiten hi
dat<-Unternehmen$Branche
hTabelle<-table(dat)
hTabelle
#relative Häufigkeiten fi
fTabelle<-hTabelle/sum(hTabelle)
fTabelle
#
#Grafische Darstellung der Häufigkeiten
#Stabdiagramm
plot(hTabelle)
#mit Beschriftung der Achsen für relative Häufigkeiten
plot(fTabelle, xlab="Branche", ylab="Häufigkeit")
#Balkendiagramm
barplot(hTabelle)
#Kuchendiagramm
pie(hTabelle, main="Kuchendiagramm")
#
#
#Auswertung des Merkmals "Umsatz"
#================================
#
#Häufigkeitstabelle und Stabdiagramm
dat<-Unternehmen$Umsatz
hTabelle<-table(dat)
fTabelle<-hTabelle/sum(hTabelle)
plot(fTabelle)
#
#Ordinalskaliertes Merkmal wird im Bsp durch Klassenmitte ersetzt
#Befehl: Datenmanagement/Variablen bearbeiten/Recodiere Variablen
#(Bei Problemen: Neustart von R)
Unternehmen$UmsatzMittel <- recode(Unternehmen$Umsatz, 
  '"A"=500; "B"=3000; "C"=7500; "D"=15000; "E"=35000; ', 
  as.factor.result=FALSE)
#Häufigkeitstabelle und Stabdiagramm
dat<-Unternehmen$UmsatzMittel
plot(table(dat)/sum(table(dat)),xlim=c(0,50000))
#Vgl. Klassierte Daten
#
#
#Auswertung des Merkmals "Standorte"
#===================================
#
#Häufigkeiten
dat<-Unternehmen$Standorte
hTabelle<-table(dat)
fTabelle<-hTabelle/sum(hTabelle)
plot(fTabelle)
#
#Zusammenfassung zu Klassen über Histogrammfunktion
histTabelle<-hist(dat)
#
#Klassengrenzen selbst festlegen
hTabelle<-table(cut(Unternehmen$Standorte,breaks=c(0,3,6,9,12,15,18)))
fTabelle<-hTabelle/sum(hTabelle)
barplot(fTabelle,space=0)
#
#Empirische Verteilungsfunktion
plot.ecdf(dat)
hTabelle<-table(dat)
fTabelle<-hTabelle/sum(hTabelle)
plot(as.table(cumsum(fTabelle)),type="b")
#
#
#Lageparameter (Standorte)
#=========================
#
dat<-Unternehmen$Standorte
#
#Median
median(dat)
#
#arithmetisches Mittel
mean(dat)
#
#Quantile
quantile(dat)
#
#Zusammenfassung
summary(dat)
#
#
#Streuungsmaße (Standorte)
#=========================
#
dat<-Unternehmen$Standorte
#
#Spannweite
max(dat)-min(dat)
#
#Mittlere Abweichung
n<-length(dat)
sum(abs(dat-mean(dat)))/n
#
#Varianz - Korrektur für beschreibende Statistik
var(dat)*(n-1)/n
#
#Standardabweichung - beschreibende Statistik
sqrt(var(dat)*(n-1)/n)
#
#Variationskoeffizient
sqrt(var(dat)*(n-1)/n)/mean(dat)
#
#
#Geometrisches Mittel
#====================
#
dat<-c(1.05,1.07,1.04,1.02,1.01,1.08,1.06,1.04,1.05,1.06)
#
#Durchschnittszins (arith. Mittel)
n<-length(dat)
sum(dat)/n
#
#Durchschnittswachstum (geom. Mittel)
prod(dat)^(1/n)
#
#
#Harmonisches Mittel
#===================
#
#Durchschnittlicher Einstandspreis (harm. Mittel)
#
dat<-c(0.5,1,1.5)
#
n<-length(dat)
n/sum(1/dat)
#
#
#Spezialfall "klassierte Daten" (UmsatzMittel)
#=============================================
#
dat<-Unternehmen$UmsatzMittel
#
#Darstellung des Histograms inklusive Berechnungen
erg<-hist(dat,breaks=c(0,1000,5000,10000,20000,50000))
#
#Klassenbreite
diff(erg$breaks)
#
#Klassenmitte
erg$mids
#
#Normierte relative Häufigkeit
erg$density
#
#Verteilungsfunktion
fVert<-cumsum(table(dat)/sum(table(dat)))
#
#Darstellung der Verteilungsfunktion
plot(as.table(fVert),type="b")
#
#Mittelwert
mean(dat)
#
#Keine Funktionen für weitere Berechnungen bei klassierten Daten
#