Seaborn - это библиотека для создания статистической графики на Python. Он построен на основе matplotlib и тесно интегрируется со структурами данных pandas.

Seaborn поможет вам изучить и понять ваши данные. Его функции построения графиков работают с фреймами данных и массивами, содержащими целые наборы данных, и внутренне выполняют необходимое семантическое отображение и статистическую агрегацию для создания информативных графиков. Его декларативный API, ориентированный на набор данных, позволяет вам сосредоточиться на том, что означают различные элементы ваших графиков, а не на деталях их рисования.

Функции Seaborn

  1. Абстракция API между визуализациями: универсального лучшего способа визуализации данных не существует. На разные вопросы лучше всего отвечают разные сюжеты. Seaborn упрощает переключение между различными визуальными представлениями с помощью согласованного API, ориентированного на наборы данных.
  2. Статистическая оценка и полосы ошибок. Часто нас интересует среднее значение одной переменной как функция других переменных. Многие функции морского транспорта автоматически выполняют статистическую оценку, необходимую для ответа на эти вопросы.

Статистическая оценка морского транспорта выходит за рамки описательной статистики. Например, можно улучшить диаграмму рассеяния, включив модель линейной регрессии (и ее неопределенность) с помощью lmplot().

3. Информативные сводные данные о распределении. Статистический анализ требует знания о распределении переменных в вашем наборе данных. Функция seaborn displot() поддерживает несколько подходов к визуализации распределений. К ним относятся классические методы, такие как гистограммы, и подходы, требующие больших вычислительных ресурсов, такие как оценка плотности ядра.

Seaborn также пытается продвигать мощные, но менее знакомые методы, такие как вычисление и построение эмпирической кумулятивной функции распределения данных.

4. Специализированные графики для категориальных данных: несколько специализированных типов графиков в seaborn ориентированы на визуализацию категориальных данных. Доступ к ним можно получить через catplot(). Эти графики предлагают разные уровни детализации. На самом высоком уровне вы можете захотеть увидеть каждое наблюдение, нарисовав «рой» график: график рассеяния, который регулирует положения точек вдоль категориальной оси так, чтобы они не перекрывались.

5. Составные представления для многомерных наборов данных. Некоторые функции seaborn объединяют несколько видов графиков для быстрого получения информативных сводок набора данных. Один, jointplot(), фокусируется на одинарных отношениях. Он отображает совместное распределение между двумя переменными вместе с предельным распределением каждой переменной.

Другой, pairplot(), использует более широкий взгляд: он показывает совместное и предельное распределение для всех парных отношений и для каждой переменной, соответственно.

6. Классы и функции для создания сложной графики: эти инструменты работают, комбинируя функции построения на уровне осей с объектами, которые управляют компоновкой фигуры, связывая структуру набора данных с сеткой из топоры . Оба элемента являются частью общедоступного API, и вы можете использовать их напрямую для создания сложных фигур с помощью всего лишь нескольких строк кода.

7. Мнения по умолчанию и гибкая настройка: Seaborn создает полную графику с помощью одного вызова функции: когда это возможно, его функции будут автоматически добавлять информативные метки осей и легенды, объясняющие семантические сопоставления на графике.

Во многих случаях seaborn также выбирает значения по умолчанию для своих параметров на основе характеристик данных. Например, в отображениях цветов, которые мы видели до сих пор, использовались различные оттенки (синий, оранжевый, а иногда и зеленый) для представления различных уровней категориальных переменных, присвоенных hue. При отображении числовой переменной некоторые функции переключаются на непрерывный градиент.

В Seaborn есть множество опций по сравнению с matplotlib. Чтобы узнать о более удивительных возможностях seaborn, посетите их веб-сайт здесь.

На мой взгляд, наука о данных столь же эффективна, как и ее представление, и с такой библиотекой, как Seaborn, вы можете научиться лучше всего представлять статистику. Seaborn - это обязательная библиотека, и вы можете быть уверены, что проявляете интерес к проектам в области науки о данных, с которыми мы часто склонны становиться шаткими.

Расскажите мне свое мнение о Seaborn и его функциях в комментариях, а также поделитесь другими удивительными мыслями о науке о данных.

Источники:

  1. Seaborn.pydata.org
  2. Python-graph-gallery.com