Имам тази рамка от данни, наречена цел:
target:
group
170 64.22-1-00
72 64.22-1-00
121 35.12-3-00
99 64.22-1-00
19 35.12-3-00
Искам да създам нова колона, наречена group_incidence, която е съотношението на честотата, с която групата се появява в рамката с данни. Изчислява се така:
[total number of times that that 'group' appeared in the group column]/len(target.index)
Ще изглежда така:
group group_incidence
170 64.22-1-00 0.6
72 64.22-1-00 0.6
121 35.12-3-00 0.4
99 64.22-1-00 0.6
19 35.12-3-00 0.4
Успях да направя това чрез for
цикъл, но тъй като това е голяма рамка от данни, отнема твърде много време. Вярвам, че ако мога да пропусна for цикъла, ще имам значителни печалби в производителността.
Има ли начин да се извърши същата операция, без да се преминава през for цикъла?