Одна из бурно развивающихся технологий, наука о данных достигает своего пика очень быстро. Что касается этой конкретной технологии, сегодня мы рассмотрим проверку гипотез.
Чувствуете себя гипотетически? Расслабляться!

Это очень простые понятия. Не так, как пиратские сокровища, которые нужно найти.
Итак, зачем ждать, давайте погрузимся в тему!
Гипотеза обычно означает начальный шаг или начальную стадию спорного или сложного допроса или расследования.
Да, теперь вы можете спросите меня или смотрите на меня, почему я собираюсь использовать эту стратегию в своих данных!
Остынь! Я объясню почему!
Позвольте мне рассказать сценарий!
Представьте себе преступника перед судьей с достаточным количеством улик. Даже улики достаточно веские, чтобы доказать, что преступление было совершено именно этим преступником.
Первый вопрос задаст судья.
Вопрос будет таким: «Вы приняли приобретение, представленное на вас? «
Если преступник пожалеет о приобретении, скажут доказательства. Итак, здесь есть две категории.
Одна — да, другая — нет. Как Принятие и Регрессия.
Если он пожалеет об этом, судья запросит его снова. Если он согласится, наказание будет.
Какой здесь главный параметр!?
Да, доказательства!

В Data Science Проверка гипотез данные являются нашим доказательством!
У нас есть определенная формула для ее разрешения и анализа данных, предоставленных клиентом.
Эта стратегия в основном заключается в игнорировании или очистке нежелательных данных, присутствующих в
наборы данных. Проверка гипотезы оценивает между двумя взаимоисключающими императивами или утверждениями.
Два утверждения классифицируются как нулевая гипотеза и альтернативная гипотеза.
Нулевая гипотеза может быть представлена ​​как H0, а Альтернативная может быть представлена ​​как H1.
H0 означает нет различий в данных, представленных в наборах данных.
H1 означает, что между данными в наборах данных есть различие.
Если Ho принимается, H1 будет отклонен.
Наоборот, для H1, который означает, что каждая из них противоположна друг другу.
Два типа ошибок играют основную роль в гипотезе.
Одна из них относится к типу I и называется ложноотрицательной. Здесь аналитик или исследователь отвергает нулевую гипотезу.
Ошибка типа II является ложноположительной. Здесь Исследователь не может отклонить нулевую гипотезу или принять альтернативную гипотезу.
Если нулевая гипотеза верна, ошибка первого рода терпит неудачу.
Если альтернативная гипотеза верна, ошибка второго рода терпит неудачу.

Явно сбивает с толку?
Не беспокойтесь! Я как новичок очень запутался! Это обычное дело, позвольте мне привести наглядный пример!
Возьмем первый сценарий, о котором я уже упоминал.
Здесь аналитиком будет судья.
Доказательства крематория представлены в виде наборов данных. Это может быть правдой или ложью. Преступник еще не
100% доказан. Теперь судья должен проанализировать.

Позвольте мне дать четыре утверждения.
Если человек был вором, он украл ювелирный магазин.
Если он не тот вор, в магазине нет кражи.
Теперь представьте Хо Тэ человек был вором.
H1 как Не вор.
Ошибка типа 1 будет означать, что кража произошла в магазине.
Ошибка типа 2 будет означать, что кража там не произошла.
Теперь соотнесите с этим утверждением.

Это основные характеристики для новичков. В этой же теме много параметров и зон. Учитесь с самого начала!

Таким образом, основным преимуществом этой стратегии является получение именно тех данных, которые необходимы для процесса анализа. Используя языковые пакеты Python или R, аналитики и ученые могут очищать наборы данных.
Используя эту стратегию, аналитики и ученые могут свести к минимуму ошибки данных и технические ошибки при исследовании данных. После очистки и тестирования набор данных готов к дальнейшей обработке.
Эта стратегия также применима для инструментов и программного обеспечения для анализа данных. Но высокая точность достигается кодированием, очевидно.
Итак, давайте научимся кодировать и станем мастерами.

В следующей теме мы увидим дальнейшие шаги и процедуры с использованием кодов!

Распространяйте позитивный настрой! Не только отношение!