Во-первых, я уже прочитал следующий поток: ggplot2 — многогрупповая гистограмма с пропорциями внутри группы, а не частотой
Я последовал предложению ddply, и, похоже, это не сработало для моих данных. Логически код должен отлично работать с моим набором данных, и я понятия не имею, что я делаю неправильно.
В целом: я хотел бы сделать гистограмму (я изучаю ggplot), которая отображает частоту генотипа в каждой из моих учебных групп.
Что-то вроде этого:
Вот фиктивный набор данных, который отражает мой собственный:
df<-data.frame(ID=1:60,
Genotypes=sample(c("CG", "CC", "GG"), 60, replace=T),
Study_Group=sample(c("Control", "Pathology1", "pathology2"), 60, replace=T))
Я пробовал варианты p + geom_bar(aes(aes(y = ..count../sum(..count..))
, но r возвращает «не удается найти объект« count »» или что-то в этом роде.
Я также пробовал:
df.new<-ddply(df,.(Study_Group),summarise,
prop=prop.table(table(df$Genotype)),
Genotype=names(table(df$Genotype)))`
И я считаю, что произошла ошибка с функцией суммирования, но, честно говоря, я понятия не имею, что делаю.
Является ли проблема просто моим пониманием решения или это что-то существенно отличающееся от моего набора данных?
Спасибо за помощь.