Публикации по теме 'data-analysis'


15 шагов для начала работы с Pandas — Полное руководство для начинающих
Основные функции Pandas для работы с данными — чтение, запись и управление данными Pandas — это быстрый, мощный, гибкий и простой в использовании инструмент для анализа и обработки данных с открытым исходным кодом, созданный на основе языка программирования Python. Освоение Pandas поднимет ваши навыки анализа на новый уровень, а знание лучших практик сэкономит вам много времени и энергии. В этой статье мы рассмотрим библиотеку Pandas и способы ее использования для обработки различных..

КАК НАЧАТЬ СТРАТЕГИИ ДАННЫХ И АНАЛИТИКИ
Директора по данным осознают важность данных для принятия обоснованных деловых решений, но часто пытаются связать данные с конкретными бизнес-преимуществами и результатами. В недавней статье Gartner выяснилось, что директора по данным осознают важность данных для принятия обоснованных бизнес-решений, но часто пытаются связать данные с конкретными бизнес-преимуществами и результатами. Более того, большинству лидеров в области данных и аналитики трудно определить, сформулировать и сообщить..

XGboost против повышения градиента на основе гистограммы. Учитесь на моем опыте
Если вы здесь только для кода, перейдите к нижней части статьи. Вы получите то, что хотите. Если вы не против прочитать, вы также поймете, почему! Один из проектов, над которым я работал, включал прогнозирование выходной переменной на основе различных входных характеристик, в основном связанных с историческими значениями той же переменной и другими. Изучив различные алгоритмы машинного обучения, я решил использовать для этой задачи старый добрый регрессор с повышением градиента...

Новаторский анализ киберспорта на основе данных
Один месяц в Splyce - выбор технологий и первые вызовы Как ведущий член нашей ветви анализа данных, мне пришлось построить нашу систему с нуля и выбрать, какие технологии использовать для каждой части стека. Я думаю, что изучение процесса, которому я следовал, чтобы создать эффективную рабочую среду, может быть полезно для людей, интересующихся наукой о данных и желающих открыть ее с помощью данных, которые им нравятся! Доступные данные Первый шаг при настройке вашей среды - это..

Magic: The Gathering встречает науку о данных
Magic: The Gathering уже много лет является одним из моих увлечений. Благодаря большой карточной базе и долгой истории он идеально подходит для анализа данных и машинного обучения. Если вы пропустили мою предыдущую статью , я применил кластеризацию K-средних (метод неконтролируемого обучения) к набору данных Magic: The Gathering Dataset, который я соскоблил с mtgtop8 . В этой статье объясняется техническая сторона, но не рассматриваются результаты, потому что я не думал, что моим..

Основы статистики для науки о данных и анализа
Статистика — это раздел математики, который занимается сбором, анализом, интерпретацией, представлением и организацией данных. Он включает в себя выводы и выводы на основе данных. 1. Типы данных В статистике данные можно разделить на различные типы в зависимости от их характера и характеристик. Двумя основными типами данных являются числовые (количественные) и категориальные (качественные). Давайте рассмотрим каждый тип: 1.1. Числовые (количественные) данные: Числовые данные..

Как удалить дубликаты в Python Pandas: пошаговое руководство
В анализе данных и машинном обучении крайне важно работать с чистыми и точными данными. Часто наборы данных, с которыми вы работаете, могут содержать дубликаты, которые могут вызвать проблемы в вашем анализе или прогнозах. К счастью, Python Pandas предоставляет простой способ удаления дубликатов из ваших данных. В этом руководстве мы шаг за шагом рассмотрим процесс удаления дубликатов в Python Pandas. Мы начнем с импорта библиотеки Pandas и создания образца DataFrame с повторяющимися..