Бих искал да премахна от моята рамка с данни колони с дублирани стойности във всички редове.
Имам рамка от данни като тази:
test = [('a', 1, 'a', 34, 'b', 34,'a'),
('a', 1, 'a', 30, 'v', 30,'a'),
('a', 1, 'a', 16, 'a', 16,'a'),
('a', 1, 'a', 30, 'a', 30,'a'),
('a', 1, 'a', 30, 'v', 30,'a'),
('a', 1, 'a', 30, 'd', 30,'a'),
('a', 1, 'a', 40, 'a', 40,'a'),
('a', 1, 'a', 30, 'a', 30,'a')
]
test_df = pd.DataFrame(test, columns=['col1', 'col2', 'col3', 'col4', 'col5', 'col6', 'col7'])
Както виждате колони: col1, col3, col4, col6, col7 имат дублиращи се стойности във всички редове и моят изключен изход трябва да бъде рамка с данни без дублиращи се колони. За да бъда по-точен, бих искал да запазя само една от дублиращите се колони, може да бъде напр. col1 и col4