Ако искам да изчисля средната стойност на две категории в Pandas, мога да го направя по следния начин:
data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()
Category: values:
cat1 2.666667
cat2 1.600000
Имам много данни, форматирани по този начин, и сега трябва да направя T-тест, за да видя дали средната стойност на cat1 и cat2 са статистически различни. Как мога да направя това?