Публикации по теме 'data-analysis'
15 шагов для начала работы с Pandas — Полное руководство для начинающих
Основные функции Pandas для работы с данными — чтение, запись и управление данными
Pandas — это быстрый, мощный, гибкий и простой в использовании инструмент для анализа и обработки данных с открытым исходным кодом, созданный на основе языка программирования Python. Освоение Pandas поднимет ваши навыки анализа на новый уровень, а знание лучших практик сэкономит вам много времени и энергии.
В этой статье мы рассмотрим библиотеку Pandas и способы ее использования для обработки различных..
КАК НАЧАТЬ СТРАТЕГИИ ДАННЫХ И АНАЛИТИКИ
Директора по данным осознают важность данных для принятия обоснованных деловых решений, но часто пытаются связать данные с конкретными бизнес-преимуществами и результатами.
В недавней статье Gartner выяснилось, что директора по данным осознают важность данных для принятия обоснованных бизнес-решений, но часто пытаются связать данные с конкретными бизнес-преимуществами и результатами.
Более того, большинству лидеров в области данных и аналитики трудно определить, сформулировать и сообщить..
XGboost против повышения градиента на основе гистограммы. Учитесь на моем опыте
Если вы здесь только для кода, перейдите к нижней части статьи. Вы получите то, что хотите. Если вы не против прочитать, вы также поймете, почему!
Один из проектов, над которым я работал, включал прогнозирование выходной переменной на основе различных входных характеристик, в основном связанных с историческими значениями той же переменной и другими. Изучив различные алгоритмы машинного обучения, я решил использовать для этой задачи старый добрый регрессор с повышением градиента...
Новаторский анализ киберспорта на основе данных
Один месяц в Splyce - выбор технологий и первые вызовы
Как ведущий член нашей ветви анализа данных, мне пришлось построить нашу систему с нуля и выбрать, какие технологии использовать для каждой части стека. Я думаю, что изучение процесса, которому я следовал, чтобы создать эффективную рабочую среду, может быть полезно для людей, интересующихся наукой о данных и желающих открыть ее с помощью данных, которые им нравятся!
Доступные данные
Первый шаг при настройке вашей среды - это..
Magic: The Gathering встречает науку о данных
Magic: The Gathering уже много лет является одним из моих увлечений. Благодаря большой карточной базе и долгой истории он идеально подходит для анализа данных и машинного обучения.
Если вы пропустили мою предыдущую статью , я применил кластеризацию K-средних (метод неконтролируемого обучения) к набору данных Magic: The Gathering Dataset, который я соскоблил с mtgtop8 . В этой статье объясняется техническая сторона, но не рассматриваются результаты, потому что я не думал, что моим..
Основы статистики для науки о данных и анализа
Статистика — это раздел математики, который занимается сбором, анализом, интерпретацией, представлением и организацией данных. Он включает в себя выводы и выводы на основе данных.
1. Типы данных
В статистике данные можно разделить на различные типы в зависимости от их характера и характеристик. Двумя основными типами данных являются числовые (количественные) и категориальные (качественные). Давайте рассмотрим каждый тип:
1.1. Числовые (количественные) данные:
Числовые данные..
Как удалить дубликаты в Python Pandas: пошаговое руководство
В анализе данных и машинном обучении крайне важно работать с чистыми и точными данными. Часто наборы данных, с которыми вы работаете, могут содержать дубликаты, которые могут вызвать проблемы в вашем анализе или прогнозах. К счастью, Python Pandas предоставляет простой способ удаления дубликатов из ваших данных.
В этом руководстве мы шаг за шагом рассмотрим процесс удаления дубликатов в Python Pandas. Мы начнем с импорта библиотеки Pandas и создания образца DataFrame с повторяющимися..