Если настройка по умолчанию не соответствует вашим требованиям

Pandas - очень мощная библиотека анализа данных Python, которая ускоряет этапы предварительной обработки вашего проекта. Основная структура данных Pandas - это DataFrame, который представляет данные в табличной форме с помеченными строками и столбцами. Pandas имеет множество вариантов отображения DataFrame. В большинстве случаев настройки по умолчанию работают хорошо, но вам может потребоваться их корректировка в зависимости от характеристик набора данных. Благодаря широкому диапазону параметров настройки pandas позволяет создавать индивидуальные настройки отображения.

Параметры отображения можно обрабатывать с помощью двух функций:

  • get_option: показывает вариант настройки
  • set_option: позволяет изменить параметр

Давайте импортируем образец фрейма данных и рассмотрим примеры:

import pandas as pd
import numpy as np
df = pd.read_csv("/content/Telco-Customer-Churn.csv")
df.shape
(7043, 21)
df.head()

Фрейм данных имеет 21 столбец, но отображаются только 10 столбцов. Те, что посередине, представлены точками. Мы можем легко настроить это, но давайте сначала изучим вариант отображения столбцов:

pd.get_option("display.max_columns")
10

Как и ожидалось, 10. Мы можем настроить его с помощью аналогичного синтаксиса, используя функцию set_option и указав, сколько столбцов отображать:

pd.set_option("display.max_columns", 25)
df.head()

Теперь отображаются все столбцы. Они не умещаются на экране, но мы можем увидеть их с помощью полосы прокрутки внизу.

Эта опция полезна, когда у нас есть широкие фреймы данных, которые содержат много функций наблюдения.

Аналогичный вариант существует для отображения строк:

pd.get_option("display.max_rows")
60

Поэтому, если мы хотим просмотреть 100 строк, мы можем настроить этот параметр аналогичным образом:

pd.set_option("display.max_rows", 100)

Также есть возможность настроить отображаемую ширину столбца. В некоторых случаях наборы данных включают длинные строки, которые слишком длинные для отображения с настройками по умолчанию. Если мы хотим просмотреть всю строку, мы можем использовать параметр max_colwidth. Давайте сначала посмотрим на вариант по умолчанию:

pd.get_option("display.max_colwidth")
50

Таким образом, если ячейка содержит более 50 символов, мы не сможем увидеть все это. Я создал простой фрейм данных, чтобы показать, как он выглядит в усеченном виде:

Увеличим ширину, чтобы увидеть текст полностью:

pd.set_option("display.max_colwidth", 150)

Другой вариант отображения, который нам может потребоваться настроить, - это точность чисел с плавающей запятой. Значение по умолчанию должно работать нормально, но могут быть некоторые крайние случаи, требующие большей точности:

pd.get_option("display.precision")
6

Значение по умолчанию - 6. Давайте увеличим его до 10. Мы также можем уменьшить его, чтобы все выглядело проще.

pd.set_option("display.precision", 10)

Есть еще много параметров отображения Pandas, которые можно настроить. Я хотел выделить те, которые могут вам понадобиться чаще. Если вы хотите увидеть весь список, вы всегда можете посетить Документацию Pandas.

Если вы хотите узнать больше о Pandas, вот список подробных сообщений Pandas:

Спасибо за чтение. Пожалуйста, дайте мне знать, если у вас есть какие-либо отзывы.