R – Četnost podruhé

Mějme následující data:

> head(dotaznik.csv[,c(2,3)])
 type gender
1  H   F
2  H   M
3  A   F
4  A   M
5  A   F
6  H   M

A potřebujeme zjistit absolutní a relativní četnost výskytu žen a mužů, rozdělenou ještě podle hodnoty v type .

> tbl <- table(dotaznik.csv$gender, dotaznik.csv$type)
> tbl
  
   A H
 M 18 16
 Ž 17 19

Opět převedeme na data frame

> tbl.frame <- as.data.frame(tbl)
> tbl.frame
 Var1 Var2 Freq
1  M  A  18
2  Ž  A  17
3  M  H  16
4  Ž  H  19

A máme absolutní četnost. Teď vypočítáme relativní četnost.

> library(plyr) 
> ddply(tbl.frame, .(Var2), transform, prop=Freq/sum(Freq))
 Var1 Var2 Freq   prop
1  M  A  18 0.5142857
2  Ž  A  17 0.4857143
3  M  H  16 0.4571429
4  Ž  H  19 0.5428571

Což znamená: pro každý subset z framu tbl.frame , rozdělený podle proměnné Var2 , proveď transform , a vypočti relativní četnost podle frekvence (abs. četnosti) a součtu hodnot frekvence.

Posted in R

Leave a Reply

Your email address will not be published. Required fields are marked *

8 × 1 =