Публикации по теме 'data-analysis'


Извлечение значения ($) из матрицы путаницы
Матрица путаницы — это тип таблицы непредвиденных обстоятельств , используемой либо для обобщения , либо для визуализации производительности . em>о машинном обучении Модели классификации . Он определяет, насколько хорошо (или плохо) работает алгоритм в классификационных задачах, и имеет основополагающее значение для получения таких показателей производительности, как точность , отзыв , Точность , Специфичность , а также кривые AUC и ROC . Но как извлечь ценность (в..

Как глубокое обучение стало огромной силой в мире искусственного интеллекта
Алгоритмы глубокого обучения произвели революцию в приложениях компьютерного зрения, заставив машины работать для множества задач, таких как распознавание изображений, обработка естественного языка, вождение автономных транспортных средств, прогнозирование определенных событий в бизнесе и т. Д. В этой статье мы увидим, как глубокое обучение стало огромной силой в мире искусственного интеллекта. Введение в глубокое обучение На заре ИИ исследователи создали алгоритмы, основанные на наборе..

Множественная линейная регрессия — За 9 шагов!
Шаг 1: Установите Анаконду https://www.anaconda.com/products/distribution Шаг 2. Установите ноутбуки Jupyter https://www.geeksforgeeks.org/how-to-install-jupyter-notebook-in-windows/ Шаг 3. Установите библиотеки данных и пакеты для анализа и анализа данных с помощью программирования на Python. Пример кода: #Импорт библиотек и пакетов для аналитики данных и обработки данных import numpy as np import pandas as pd from pandas import Series, DataFrame import seaborn as sns..

ОСНОВЫ ОБРАБОТКИ ДАННЫХ, ОБЪЯСНЕННЫЕ НА ПРИМЕРАХ
СОДЕРЖАНИЕ 1. Введение 2. Сбор данных 3. Оценка данных 4. Очистка данных ВВЕДЕНИЕ Говорят, что данные — это топливо будущего, и, как и любое другое топливо, они должны пройти через нефтеперерабатывающий завод, чтобы стать полезными. Мы научимся уточнять данные, чтобы сделать их полезными. Процесс уточнения не является очисткой данных. Не удивляйтесь, это называется обработкой данных. Хотя заблуждение состоит в том, что очистка данных является важным шагом в обработке..

Прогнозирование популярности комментариев The New York Times (часть 1)
Всем привет! Я только что закончил свой главный проект по получению сертификата больших данных от Университета Райерсона в Торонто. Этот проект был довольно сложным, но требовал огромных знаний. Я потратил почти месяц на ее окончательную доработку и подготовку отчета. Следуйте подробному пошаговому коду R на моем GitHub . В первой части мы поговорим о постановке проблемы и познакомим вас с набором данных и различными визуализациями, которые я придумал для лучшего понимания..

Анализ данных: полный план изучения науки о данных  —  Часть 2
Фото Мириам Джессиер на Unsplash Прежде чем перейти к более интересным частям проектов, таким как машинное обучение, специалисту по обработке данных сначала необходимо потратить время на поиск, извлечение, объединение и реорганизацию данных. Эти данные, вероятно, также потребуют некоторой очистки и преобразования, прежде чем они станут пригодными для использования. Кроме того, перед моделированием важно проанализировать данные, чтобы понять размер, форму и объем набора данных, а..

Что больше всего влияет на цены на жилье Airbnb?
Что больше всего влияет на цены на жилье Airbnb? Набор данных, предоставленный Airbnb для анализа причин размещения квартиры по определенной цене. Введение Прошлым летом я дважды был в Бостоне и два раза бронировал жилье на Airbnb, после чего начал задаваться вопросом, на какие характеристики люди полагаются, чтобы выставлять дома с такими ценами. Кто-то скажет, что наибольшее влияние оказывает соседство, а кто-то скажет, что количество комнат. Но что говорят нам данные?..