Используйте Mitosheet для создания визуализаций в пару кликов

Визуализации, такие как диаграммы, гистограммы и гистограммы, помогают нам исследовать и лучше понимать наши данные. Однако создание графиков с помощью Seaborn или Pandas может занять много времени (не говоря уже о Matplotlib).

Такие библиотеки хороши для создания красивых визуализаций с широкими возможностями настройки, но когда вы спешите и эстетика вашего сюжета не является приоритетом, есть альтернатива, которая сэкономит ваше время — Mito.

В этой статье я покажу вам, как использовать библиотеку Mito для создания визуализации данных за считанные секунды всего за пару кликов.

Монтаж

Для визуализации без программирования нам необходимо установить Mito (необходим Python 3.6 или выше, а также JupyterLab)

Чтобы установить Mito, откройте новый терминал или командную строку и выполните следующую команду (если возможно, установите ее в новой виртуальной среде):

python -m pip install mitoinstaller
python -m mitoinstaller install

Если у вас уже есть Mito, убедитесь, что у вас установлена ​​самая последняя версия mitoinstaller, выполнив следующую команду:

python -m pip install mitoinstaller --upgrade

Затем запустите процесс обновления:

python -m mitoinstaller upgrade

После этого перезапустите ядро ​​JupyterLab и обновите страницу браузера, чтобы загрузить новую версию Mito. Чтобы узнать, что нового в последних обновлениях, ознакомьтесь с официальной документацией.

Создайте фрейм данных с митолистом

Чтобы создать фрейм данных с Mito, нам нужно только import mitosheet и инициировать его, набрав mitosheet.sheet().

import mitosheet
mitosheet.sheet()

Приведенный выше код создаст митолист. Теперь мы можем продолжить и импортировать набор данных.

В этом руководстве мы будем использовать CSV-файл StudentsPerformance_id, доступный на Google Диске, который я сгенерировал самостоятельно, используя случайные данные.

Чтобы импортировать этот набор данных с помощью Mito, нажмите кнопку «Импорт», а затем выберите файл CSV, как показано ниже:

Примечание. После внесения изменений в фрейм данных с помощью Mito проверьте ячейку ниже, чтобы увидеть код, автоматически сгенерированный Mito. В случае с графиками вы можете просто нажать кнопку «Копировать код графика» в правом нижнем углу.

Блочная диаграмма

Блочная диаграмма помогает нам увидеть, как распределяются наши данные. Это показывает минимальное значение, первый квартиль (Q1), медиану, третий квартиль (Q3) и максимальное значение. Чтобы легко увидеть эти значения, мы должны создать интерактивную диаграмму. С Mito нам нужно всего пару кликов, чтобы создать коробочную диаграмму.

Давайте создадим ящичковую диаграмму для оценки по математике, чтению и письму. Для этого нажмите кнопку «График», а затем выберите «поле» в опции «Тип диаграммы». После этого добавьте нужные столбцы к оси X или Y, чтобы получить горизонтальную или вертикальную диаграмму соответственно.

Созданная ящичковая диаграмма является интерактивной, поэтому вы можете увидеть значения за ней, наведя курсор на график.

Помните, что вы можете скопировать код графа, сгенерированный Mito. Вот код, который я получил:

Гистограмма

Гистограмма представляет распределение числовых данных. Посмотрим, как распределятся баллы по математике.

Чтобы сделать гистограмму с помощью Mito, нажмите кнопку «График», а затем выберите «гистограмма» в опции «Тип диаграммы». После этого добавьте столбцы к оси X, если вы хотите получить вертикальную гистограмму, как показано ниже.

На гистограмме мы видим, что большинство учащихся (представленных самой высокой полосой) получили на экзамене по математике от 65 до 69 баллов.

Барплот

Гистограмма показывает категориальные данные в виде столбцов с весами, пропорциональными значениям, которые они представляют.

Чтобы сделать гистограмму с использованием этого набора данных, сначала нам нужно создать сводную таблицу. В этом примере мы сгруппируем баллы по математике и баллы по чтению в столбце «раса/этническая принадлежность» (столбец группы), чтобы увидеть средний балл для каждой группы.

Чтобы создать сводную таблицу с помощью Mito, выполните следующие действия.

Теперь, когда у нас есть сводная таблица, мы можем создать гистограмму для этой сводной таблицы, выполнив следующие шаги:

Бонус: изменение любого значения отдельной ячейки

С Мито вы можете сделать гораздо больше. Например, вы можете изменить любое значение отдельной ячейки, как если бы вы работали с Microsoft Excel.

Допустим, мы хотим изменить счет по математике для ученика с идентификатором 1:

Как показано выше, если вы прокрутите вниз, вы увидите код Pandas, автоматически сгенерированный Mito.

Если вы хотите узнать о других функциях, доступных в Mito, ознакомьтесь с приведенным ниже руководством.



Подпишитесь на мою рассылку с более чем 10 000 человек, чтобы получить мою памятку по Python для Data Science, которую я использую во всех своих руководствах (бесплатный PDF)

Если вам нравится читать такие истории и вы хотите поддержать меня как писателя, подумайте о том, чтобы зарегистрироваться и стать участником Medium. Это 5 долларов в месяц, что дает вам неограниченный доступ к тысячам руководств по Python и статьям по науке о данных. Если вы зарегистрируетесь по моей ссылке, я получу небольшую комиссию без каких-либо дополнительных затрат для вас.