Публикации по теме 'algorithms'


Предварительная обработка текста для задач НЛП и машинного обучения
Как только вы начинаете работать над задачей по науке о данных, вы понимаете, что ваши результаты зависят от качества данных. Начальный шаг - подготовка данных - любого проекта в области науки о данных закладывает основу для эффективной работы любого сложного алгоритма. В задачах обработки текстовых данных это означает, что любой необработанный текст необходимо тщательно предварительно обработать, прежде чем алгоритм сможет его обработать. В самых общих чертах, мы берем некоторый..

Ридж-регрессия против регрессии Лассо
Машинное обучение | Контролируемое обучение Насколько хорош ваш ИИ? модель? С инженерной точки зрения очень важно точно определить точность модели. Однако новая построенная модель может дать точность почти 100%, и ваш инстинкт, скорее всего, подскажет вам, что что-то не так. Что-то действительно не так, но есть способы это исправить — Регрессия гребня и Регрессия Лассо . Переобучение — это то, как мы определяем проблему, предложенную выше. Переоснащение происходит, когда..

Краткое введение в методы-оболочки
Процесс выбора функций основан на алгоритме. Метод основан на жадном поиске . Он оценивает все возможные комбинации функций по заданному критерию оценки . И выводит комбинацию функций, обеспечивающую наиболее оптимальную производительность. Возможны три подхода. Выбор вперед

Проверка точности прогнозов ваших моделей
Написано Сабриной Херольд , Кристианом Глором и Стивеном Ван Винкелем в Tom Capital AG . В прогнозировании многое зависит от точности прогноза, который вы делаете. Есть несколько способов проверить точность вашей модели. Обычный способ измерить, насколько хорошо стратегия работала бы в прошлом, называется «бэк-тест». Большинство так называемых «бэк-тестов» разрабатываются людьми, которые очень хорошо справились со своей задачей за долгое время. К сожалению, чем лучше кто-то..

Под капотом повышения градиента и его реализации на Python
Техники повышения Под капотом Gradient Boosting и его реализации на Python Повышение эффективности алгоритмов машинного обучения - Часть 3 До сих пор мы обсуждали общее значение повышения и некоторые важные технические термины в Части 1 . Мы также обсудили Python-реализацию AdaBoost (Adaptive Boosting) в Части 2 . Сегодня мы обсудим еще один важный алгоритм повышения: Повышение градиента . Это отличная альтернатива AdaBoost, и иногда она может превзойти AdaBoost...

Почему управление данными имеет значение: как сохранить ваши данные чистыми и точными
Введение Как говорится, «Данные — это новая нефть». Это становится все более и более ценным в современном деловом мире. Но, как и в случае с нефтью, чтобы данные были полезными, их необходимо очищать и правильно управлять ими. Вот тут-то и начинается управление данными. Продолжайте читать, чтобы узнать больше о том, почему управление данными имеет значение и как сохранить ваши данные чистыми и точными!

Анатомия шахматного ИИ
Шахматные программы дебютировали в 50-х годах. Неудивительно, что они были довольно слабыми; и технологические, и теоретические ограничения не позволяли движкам играть на уровне мастеров примерно до 1990 года. Только в 1997 году программа Deep Blue смогла победить чемпиона мира Гэри Каспарова. С тех пор они полностью превзошли людей. Лучшие игроки имеют рейтинг Эло около 2800, лучшие двигатели имеют рейтинг около 3500. Разница в 700 очков примерно соответствует тому, что лучшие..