Публикации по теме 'data-analysis'
Обработка естественного языка - извлечение событий
Извлечение событий из новостных статей
Количество текста, генерируемого каждый день, ошеломляет. Миллионы каналов данных публикуются в виде новостных статей, блогов, сообщений, рукописей и многого другого, и возможность автоматически систематизировать их и обрабатывать их становится незаменимой.
Благодаря улучшениям в алгоритмах нейронных сетей, значительному увеличению мощности компьютера и легкому доступу к комплексным фреймворкам обработка естественного языка никогда не казалась..
PCA — Интуиция, стоящая за этим
Все, что нам нужно, это набор интеллектуальных базисных векторов .
Возможно, вы уже знаете, что на самом деле делает PCA абстрактно, и также использовали это в своем проекте. но вы можете не знать, как это уменьшает размеры или интуицию, стоящую за этим. Тогда эта статья для вас.
Проще говоря, PCA уменьшает размерность данных.
Предположим, у нас есть матрица данных X размерности M * N
где M = количество образцов, N = количество признаков (размеров)
Поэтому очевидно, что для..
Описательная статистика:
Почему описательная статистика имеет значение в науке о данных
В области статистики можно выделить два основных направления:
Описательная статистика
Выводная статистика
В предыдущей статье я поделился семью причинами важности статистики. В этом рассказе я приведу подробное описание описательной статистики.
Описательная статистика
Короче говоря, описательная статистика предназначена для описания блока необработанных данных с использованием сводной статистики, графиков и..
Убийство в Чикаго: повествование данных, часть вторая
Исследование и визуализация данных
Это вторая часть статьи Data Storytelling об убийствах в Чикаго, которые в последнее время были горячей темой, включая упоминания президента Трампа, когда он баллотировался на свой пост в 2017 году. Я из Чикаго, и каждый раз, когда я встречаюсь с людьми из другого штата, они не могут не поговорить со мной об уровне убийств в городе, но очень немногие люди поднимают эту тему с точки зрения осведомленности о данных.
В первой части этой серии я очистил..
Проанализируйте и создайте классификатор на основе удовлетворенности пассажиров авиакомпаний.
Анализ и создание классификатора машинного обучения для прогнозирования удовлетворенности пассажиров на основе данных одной авиакомпании США.
Введение
Авиакомпания — это бизнес, который предлагает услуги по воздушной перевозке пассажиров и грузов. Путешествие по воздуху является распространенным и эффективным способом перемещения из одного места в другое. Авиакомпании соблюдают ряд правил, чтобы авиаперелеты были безопасными и комфортными для людей.
Чтобы авиакомпания была..
Аналитика данных — Продажи Walmart (часть 1)
Чистые данные, исследование данных с помощью R
Описание данных ( Ссылка на набор данных )
Данные относятся к историческим продажам 45 магазинов Walmart, расположенных в разных регионах, с общим количеством наблюдений 537 тыс. Файл содержит дополнительные данные, связанные с деятельностью магазина, отдела и региона в указанные даты, а также характеристики магазинов Walmart, такие как скидки, которые предшествуют важным праздникам, четыре крупнейших из которых – Суперкубок, День труда..
Brontomind: сила генеративного ИИ для анализа данных
Генеративный ИИ быстро меняет способ анализа данных. Изучая закономерности в данных и используя эти знания для создания нового контента или прогнозирования результатов, генеративный ИИ может помочь предприятиям быстро определять ключевые показатели и принимать обоснованные решения на основе информации в режиме реального времени.
Одно из самых многообещающих применений генеративного ИИ в анализе данных — обнаружение аномалий. Обнаружение аномалий — это процесс выявления точек данных,..