Визуализация данных помогает нам понять данные, предоставляя визуальное представление.

Визуализация данных — это процесс представления данных в виде графиков, диаграмм и других визуальных представлений. Это помогает нам понять данные, предоставляя визуальное представление. Визуализация данных является важной частью анализа данных и машинного обучения.

Существует множество различных программных пакетов для визуализации данных. В этом уроке мы будем использовать Matplotlib и seaborn, два популярных пакета Python для визуализации данных.

Что такое Matplotlib?

Matplotlib — популярная библиотека визуализации данных на Python. Он используется для создания 2D и 3D графиков. Matplotlib — это мощный инструмент, который можно использовать для создания различных типов графиков.

Что такое Seaborn?

Seaborn — еще одна популярная библиотека визуализации данных на Python. Он используется для создания статистических графиков. Seaborn построен на основе Matplotlib и предоставляет высокоуровневый интерфейс для создания привлекательных и информативных статистических графиков.

Мы будем использовать Matplotlib и seaborn для визуализации данных из набора данных. Набор данных содержит информацию о загрязнении воздуха в разных частях мира. Мы будем использовать эти данные для создания линейных графиков, гистограмм и точечных диаграмм.

Линейные графики

Линейный график — это тип графика, показывающий, как величина изменяется во времени. Линейные графики часто используются для визуализации данных из данных временных рядов.

Чтобы создать линейный график, мы используем функцию plot() из Matplotlib. Функция plot() принимает два аргумента:

x: x-координаты точек данных.

y: Y-координаты точек данных.

Нам также необходимо указать стиль и цвет линии. Мы можем сделать это, используя аргументы стиля линии и цвета.

Следующий код создает линейный график данных такси:

import seaborn as sns
sns.set()
data = sns.load_dataset(“taxis”)
plt.plot(data[“fare”], data[“total”], linestyle=”-”, color=”b”)
plt.show()

Вывод

Функция plot() создает линейный график данных. Координаты x — это тариф, а координаты y — общие значения. Стиль линии установлен как сплошная линия (-), а цвет установлен на синий (b).

Функция plot() также имеет много других опций, которые можно использовать для настройки графика. Например, мы можем изменить ширину линии, стиль и размер маркера.

Следующий код создает линейный график с более толстыми линиями и более крупными маркерами:

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
data = sns.load_dataset(“taxis”)
plt.plot(data[“fare”], data[“total”], linestyle=”-”, color=”b”,
linewidth=2, marker=”o”, markersize=8)
plt.show()

Вывод

Гистограмма

Гистограмма — это тип графика, показывающий, как количество изменяется в разных категориях. Гистограммы часто используются для визуализации данных из категориальных данных.

Чтобы создать гистограмму, мы используем функцию bar() из Matplotlib. Функция bar() принимает два аргумента:

x: x-координаты точек данных.

y: Y-координаты точек данных.

Нам также нужно указать ширину полос. Мы можем сделать это, используя аргумент ширины.

Следующий код создает гистограмму данных о загрязнении воздуха:

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
data = sns.load_dataset(“taxis”)
plt.bar(data[“fare”], data[“total”], width=0.5)
plt.show()

Вывод

Функция bar() создает гистограмму данных. Координаты x — это тариф, а координаты y — общиезначения. Ширина полос установлена ​​на 0,5.

Функция bar() также имеет много других опций, которые можно использовать для настройки графика. Например, мы можем изменить цвет полос, выравнивание полос и цвет края полос.

Следующий код создает гистограмму с синими полосами:

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
data = sns.load_dataset(“taxis”)
plt.bar(data[“fare”], data[“total”], width=0.5, color=”b”)
plt.show()

Вывод

Графики разброса

Точечная диаграмма — это тип графика, показывающий, как одна величина зависит от другой величины. Диаграммы рассеяния часто используются для визуализации данных из двумерных данных.

Чтобы создать точечную диаграмму, мы используем функцию scatter() из Matplotlib. Функция scatter() принимает два аргумента:

x: x-координаты точек данных.

y: Y-координаты точек данных.

Нам также необходимо указать стиль маркера. Мы можем сделать это, используя аргумент маркера.

Следующий код создает точечную диаграмму данных о загрязнении воздуха:

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
data = sns.load_dataset(“taxis”)
plt.scatter(data[“fare”], data[“total”], marker=”o”)
plt.show()

Вывод

Функция scatter() создает точечную диаграмму данных. Координаты x — это долгота, а координата y — широта. Маркер установлен в круг (o).

Функция scatter() также имеет много других параметров, которые можно использовать для настройки графика. Например, мы можем изменить цвет маркеров, размер маркера и цвет края маркера.

Следующий код создает точечную диаграмму с более крупными маркерами:

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
data = sns.load_dataset(“taxis”)
plt.scatter(data[“fare”], data[“total”], marker=”o”,
s=200, edgecolor=”b”)
plt.show()

Вывод

В этом уроке мы узнали, как использовать Matplotlib и seaborn для визуализации данных. Мы использовали эти библиотеки для создания линейных, столбчатых и точечных диаграмм.

Перед уходом:



Так что не ждите — зарегистрируйтесь сейчас и начните пользоваться всем, что может предложить Medium.

Если вам понравилась эта статья, пожалуйста, подпишитесь на меня и похлопайте мне, или, если вы хотите меня поддержать, «купите меня чашка кофе!" Буду очень признателен! Заранее спасибо.

Все мои статьи можно найти на этой странице.

Подпишитесь на меня в Твиттере, если хотите больше контента:

- Заработок в Интернете
- Пассивный доход
- Цифровые активы
- Подработка
- Самосовершенствование
- Личное развитие
- Отношения
- Программирование
- Наука о данных
- Искусственный интеллект
- Художественная литература

Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Посетите наш Community Discord и присоединитесь к нашему Коллективу талантов.