Публикации по теме 'data-analysis'


Плюсы и минусы популярных алгоритмов машинного обучения.
Мы все используем разные алгоритмы машинного обучения в наших проектах по науке о данных, но иногда нам нужно сосредоточиться на их преимуществах и недостатках. Когда я начал реализовывать эти алгоритмы, я всегда использовал их на основе задач регрессии или классификации, но не понимал важности их плюсов и минусов при реализации. В каждой науке о данных интервьюеров спрашивают о плюсах и минусах алгоритмов машинного обучения. Они часто спрашивают: «Почему вы внедрили алгоритм X, а не..

Основные доверительные интервалы: подробное руководство для аналитиков данных
Понимание точечных оценок Как статистик, важно знать наилучшее предположение для неизвестного параметра совокупности. Точечная оценка — это одно значение, полученное из выборки, которое служит наилучшей аппроксимацией значения неизвестного параметра генеральной совокупности, такого как среднее значение и стандартное отклонение. Точечные оценки обычно используются в статистике, чтобы делать выводы о населении, и они составляют основу многочисленных статистических анализов. Чтобы..

5 лучших типов алгоритмов кластеризации, которые должен знать каждый специалист по данным!
Кластеризация  – это метод в науке о данных, с помощью которого похожие объекты или объекты группируются в один кластер таким образом, чтобы дисперсия объектов внутри одной группы была минимальной. и это по группам является высоким. Модуль действия для этого состоит в том, чтобы найти список факторов или характеристик, которые являются общими в этих точках данных населения, а затем сгруппировать точки данных на основе их сходства с выявленными факторами или характеристиками...

Как историки собирают данные о древних империях - когда данных нет
Исследовательский анализ данных на наборе данных осевого возраста Сешат "90% of the data ever created was created in the last two years." Эта цитата из Петтера Бэ Брандтцога , сколь бы пугающей она ни была, выдает еще более пугающее наблюдение: У нас в десять раз меньше данных, записанных за последние 2,8 миллиона лет истории человечества, чем за 2016-2018 годы. Учитывая эту предполагаемую экспоненциальную скорость роста данных с начала компьютерной эры, у нас на 10 ^..

Искусственный интеллект — Преобразование отраслей и изменение жизни
Достижения, приложения и этические соображения в мире ИИ Искусственный интеллект (ИИ) — это отрасль информатики, целью которой является создание интеллектуальных машин, способных выполнять задачи, обычно требующие человеческого познания, такие как восприятие, рассуждение, обучение и принятие решений. ИИ был предметом исследований и разработок в течение нескольких десятилетий, а в последние годы он приобрел значительную популярность благодаря достижениям в области машинного обучения и..

Волшебство данных: 10 захватывающих проектов, которые ускорят ваш путь к карьере аналитика данных
В динамичном мире анализа данных практический опыт — это ваша волшебная палочка, которая откроет вам первую работу в этой области. Работодатели ищут кандидатов, которые могут не только понимать данные, но и делать из них выводы. Чтобы помочь вам выделиться как волшебник на конкурентном рынке труда, мы собрали 10 увлекательных проектов по анализу данных, которые не только отточят ваши навыки, но и поразит потенциальных работодателей. 1. Исследовательский анализ данных (EDA) реальных..

Логистическая регрессия с полной теорией и практическими примерами
Мы можем предсказать клики по рекламе с помощью дерева решений, но на этот раз мы сосредоточимся на изучении очень масштабируемой классификации, то есть на логистической регрессии. В этой статье мы поймем, что такое логистическая функция, как обучить модель логистической регрессии, добавив в модель регулирование. Вам точно не будет скучно, так как в этой статье есть реализации с нуля с помощью scikit-learn и tensorflow. Статья будет охватывать следующие темы: Категориальное..