Tipps zur Hausaufgabe

Hier einige Tipps für die Hausaufgabe:

Ermittlung von Anteilen

Hier ist ein Vektor vom Typ “logical” (auch “Boolean” genannt), der drei mal den Wert TRUE und sieben mal den Wert FALSE enthält. Der Anteil an TRUEs ist also 0.3:

lvec <- c( TRUE, FALSE, TRUE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE )

Diesen Anteil ermitteln man wie folgt:

mean( lvec )
[1] 0.3

Warum funktioniert das? Warum ermittelt die Funktion mean, die ja eigentlich Mittelwerte berechnet, hier einen Anteil?

Erinnern Sie sich daran, dass R intern FALSE als 0 und TRUE als 1 wertet, wann immer diese Boolschen Werte in einer Rechnung auftauchen. Wenn wir die Elemente von lvec aufaddieren, wird für jedes FALSE ein 0 und für jedes TRUE eine 1 gezählt. Wir erhalten also die Anzahl der TRUEs:

sum( lvec )
[1] 3

Die Funktion mean berechnet den Mittelwert eines Vektors, indem sie die Elemente des Vektors aufaddiert (genauso wie sum), und teilt den Wert dann durch die Anzahl der Elemente (hier 10). Daher

mean( lvec )
[1] 0.3

Wenn Sie mean auf diese Weise für die Aufgabe nutzen, denken Sie daran, das in group_by und summerize einzubetten.