Публикации по теме 'outliers'


Обнаружение выбросов во временных рядах с Kats и Comet
Введение Приложения временных рядов распространены повсеместно и находят применение в различных отраслях, таких как цепочка поставок, электронная коммерция, финансы, розничная торговля, биотехнологии, прогнозирование погоды, нефть и энергетика, производство, астрономия и т. д. Эти приложения генерируют данные, которые могут быть зашумлены в реальном времени. мире, так как некоторые неучтенные факторы могут повлиять на измерения. Например, на показания датчиков, используемых для..

Давайте найдем некоторые выбросы с помощью Isolation Forest
Выбросы не всегда вредны для вашей модели, на самом деле они могут быть важными точками, наличие или отсутствие которых оказывает существенное влияние. Я работал над проблемой, когда мне приходилось иметь дело с точками данных, которые не были шумом, но отличались от обычных. Я пробовал несколько подходов, таких как (LOF) Local Outlier Factor, о котором я расскажу в другом блоге, и (IF) Isolation Forest, который считается самым популярным и известным методом обнаружения таких точек данных...

Обнаружение и удаление выбросов в Python
Что такое выбросы По определению выбросы — это экстремальные точки данных в наборе данных. Чтобы упростить понимание, предположим, что вы хотите узнать среднюю зарплату в компании, и вам даны данные о зарплате 6 человек. — 5 сотрудников — Вывод 25 000 в месяц — 1 генеральный директор — получение 50 000 в месяц Теперь, если вы попытаетесь найти среднее значение, просуммировав здесь все 6 цифр окладов и разделив их на 6, вы получите 29 166, что совершенно неверно, потому что..

Выбросы: ключ к раскрытию полного потенциала ваших данных
Введение Добро пожаловать в наш последний блог о выбросах! Выбросы в статистическом плане относятся к наблюдениям, выходящим за рамки общей картины набора данных. Эти наблюдения могут оказать существенное влияние на результаты анализа данных, и важно понимать их природу, обнаружение и обработку. Цель этого блога — предоставить исчерпывающее руководство по выбросам, их значению в анализе данных и способам эффективной борьбы с ними. Мы надеемся, что к концу этого блога у вас..