Предположим, у меня есть кадр данных со странами, который выглядит так:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако вместо этого я хочу преобразовать их в индексы, чтобы вместо этого я получил cc_index = [1,2,1,3]
.
Я предполагаю, что есть более быстрый способ, чем использование get_dummies вместе с предложением numpy where, как показано ниже:
[np.where(x) for x in df.cc.get_dummies().values]
Это несколько проще сделать в R, используя «факторы», поэтому я надеюсь, что у панд есть что-то подобное.
cc_index = [0,1,0,2]
? - person juanpa.arrivillaga   schedule 29.06.2016