Опитвам се да премахна отклоненията от колоната „Цена“ в набор от данни. Успях да създам рамка от данни на извънредните стойности със съответните им стойности в други колони, но се боря да изключа тези записи от основния набор от данни. Как да направя това?
това е кодът, който използвах за създаване на новата рамка с данни, посочена по-горе:
lower_limit = pq1 - 1.5 *iqr
upper_limit = pq3 + 1.5 *iqr
newdf = df[((df['price'] < lower_limit) | (df['price'] > upper_limit))]
newdf
Опитах се да използвам знака тилда (~), преди да задам булевите операции, но това не даде желаните резултати.
df.loc[...
вместоdf[...
и прочетете документите на pandas относно индексирането - person Griffin   schedule 24.09.2020