Определить распределение для категориальных результатов относительно просто.
Мы присваиваем вероятность каждой категории.
В случаях, которые можно рассматривать как бусины в урне, для каждого типа бусинок пропорция определяет распределение.
Другой пример — опрос.
Если вы случайным образом называете вероятных избирателей из населения, состоящего из 44% демократов, 44% республиканцев, 10% неопределившихся и 2% зеленых, эти пропорции определяют вероятность для каждой группы.
В этом примере распределение вероятностей равно просто эти четыре пропорции.
Опять же, категориальные данные позволяют легко определять распределения вероятностей.
Распределение вероятностей — это функция, описывающая вероятность того, что случайная величина примет определенное значение или набор значений.
Существует несколько часто используемых распределений вероятностей, в том числе:
- Биномиальное распределение: описывает количество успешных результатов в фиксированном числе независимых испытаний с постоянной вероятностью успеха.
- Нормальное распределение: описывает непрерывную случайную величину с функцией плотности вероятности в форме колокола. Его также называют распределением Гаусса.
- Распределение Пуассона: описывает количество событий, происходящих за фиксированный интервал времени или пространства, при постоянной средней частоте возникновения.
- Экспоненциальное распределение: описывает время между событиями в процессе Пуассона, когда события происходят независимо и с постоянной средней скоростью.
- Равномерное распределение: описывает непрерывную случайную величину с постоянной функцией плотности вероятности в течение заданного интервала.
- Распределение Бернулли: описывает бинарный результат с одним испытанием, где успех определяется как один результат, а неудача определяется как другой результат.
Эти распределения обеспечивают полезный способ моделирования и анализа случайных величин, а также для прогнозирования и принятия решений на основе неопределенности.