Публикации по теме 'data-analysis'


Обработка естественного языка - извлечение событий
Извлечение событий из новостных статей Количество текста, генерируемого каждый день, ошеломляет. Миллионы каналов данных публикуются в виде новостных статей, блогов, сообщений, рукописей и многого другого, и возможность автоматически систематизировать их и обрабатывать их становится незаменимой. Благодаря улучшениям в алгоритмах нейронных сетей, значительному увеличению мощности компьютера и легкому доступу к комплексным фреймворкам обработка естественного языка никогда не казалась..

PCA — Интуиция, стоящая за этим
Все, что нам нужно, это набор интеллектуальных базисных векторов . Возможно, вы уже знаете, что на самом деле делает PCA абстрактно, и также использовали это в своем проекте. но вы можете не знать, как это уменьшает размеры или интуицию, стоящую за этим. Тогда эта статья для вас. Проще говоря, PCA уменьшает размерность данных. Предположим, у нас есть матрица данных X размерности M * N где M = количество образцов, N = количество признаков (размеров) Поэтому очевидно, что для..

Описательная статистика:
Почему описательная статистика имеет значение в науке о данных В области статистики можно выделить два основных направления: Описательная статистика Выводная статистика В предыдущей статье я поделился семью причинами важности статистики. В этом рассказе я приведу подробное описание описательной статистики. Описательная статистика Короче говоря, описательная статистика предназначена для описания блока необработанных данных с использованием сводной статистики, графиков и..

Убийство в Чикаго: повествование данных, часть вторая
Исследование и визуализация данных Это вторая часть статьи Data Storytelling об убийствах в Чикаго, которые в последнее время были горячей темой, включая упоминания президента Трампа, когда он баллотировался на свой пост в 2017 году. Я из Чикаго, и каждый раз, когда я встречаюсь с людьми из другого штата, они не могут не поговорить со мной об уровне убийств в городе, но очень немногие люди поднимают эту тему с точки зрения осведомленности о данных. В первой части этой серии я очистил..

Проанализируйте и создайте классификатор на основе удовлетворенности пассажиров авиакомпаний.
Анализ и создание классификатора машинного обучения для прогнозирования удовлетворенности пассажиров на основе данных одной авиакомпании США. Введение Авиакомпания — это бизнес, который предлагает услуги по воздушной перевозке пассажиров и грузов. Путешествие по воздуху является распространенным и эффективным способом перемещения из одного места в другое. Авиакомпании соблюдают ряд правил, чтобы авиаперелеты были безопасными и комфортными для людей. Чтобы авиакомпания была..

Аналитика данных  — Продажи Walmart (часть 1)
Чистые данные, исследование данных с помощью R Описание данных ( Ссылка на набор данных ) Данные относятся к историческим продажам 45 магазинов Walmart, расположенных в разных регионах, с общим количеством наблюдений 537 тыс. Файл содержит дополнительные данные, связанные с деятельностью магазина, отдела и региона в указанные даты, а также характеристики магазинов Walmart, такие как скидки, которые предшествуют важным праздникам, четыре крупнейших из которых – Суперкубок, День труда..

Brontomind: сила генеративного ИИ для анализа данных
Генеративный ИИ быстро меняет способ анализа данных. Изучая закономерности в данных и используя эти знания для создания нового контента или прогнозирования результатов, генеративный ИИ может помочь предприятиям быстро определять ключевые показатели и принимать обоснованные решения на основе информации в режиме реального времени. Одно из самых многообещающих применений генеративного ИИ в анализе данных — обнаружение аномалий. Обнаружение аномалий — это процесс выявления точек данных,..