Публикации

Предварительная обработка текста для задач НЛП и машинного обучения
Как только вы начинаете работать над задачей по науке о данных, вы понимаете, что ваши результаты зависят от качества данных. Начальный шаг - подготовка данных - любого проекта в области науки о данных закладывает основу для эффективной работы любого сложного алгоритма. В задачах обработки текстовых данных это означает, что любой необработанный текст необходимо тщательно предварительно обработать, прежде чем алгоритм сможет его обработать. В самых общих чертах, мы берем некоторый..

Как ускорить работу ИИ с помощью аннотации данных: 5 вопросов перед началом
ИИ становится все более интеллектуальным, поскольку для разработки таких автоматизированных машин используются лучшие исходные данные. Робототехника, дроны, беспилотные автомобили и другие приложения, основанные на компьютерном зрении, нуждаются в огромном количестве наборов данных, чтобы полностью осознавать окружающую среду и делать соответствующие прогнозы. И теперь, чтобы достичь следующего уровня точности, данные о ставках необходимы для постоянного изучения и выявления..

Создайте свою собственную информационную панель измерения и смягчения предвзятости за 5 шагов
Узнайте, как создавать информационные панели ответственного ИИ с помощью библиотек Python HolitisticAI и Streamlit. Первоначально опубликовано в Блоге Holistic AI . ИИ все больше вплетается в ткань нашей повседневной жизни. Поэтому крайне важно устранить потенциальный вред , связанный с предвзятостью в системах ИИ — это означает устранение алгоритмов, которые увековечивают дискриминацию, усиливают неравенство и приводят к несправедливым результатам. В этой статье вы..

Ридж-регрессия против регрессии Лассо
Машинное обучение | Контролируемое обучение Насколько хорош ваш ИИ? модель? С инженерной точки зрения очень важно точно определить точность модели. Однако новая построенная модель может дать точность почти 100%, и ваш инстинкт, скорее всего, подскажет вам, что что-то не так. Что-то действительно не так, но есть способы это исправить — Регрессия гребня и Регрессия Лассо . Переобучение — это то, как мы определяем проблему, предложенную выше. Переоснащение происходит, когда..

Использование Feedback() с временной задержкой
Уважаемое сообщество Matlab, Я бы ожидал такой же переходной отклик на графике в следующем коде, но переходный отклик G_y_r нестабилен, а T_CL стабилен. Единственное отличие состоит в том, что T_CL строится с помощью функции feedback(), а G_y_r строится вручную. Кто-нибудь подскажет, почему у G_y_r две внутренние задержки («Внутренние задержки (секунды): 2.5e-05 2.5e-05»), а у T_CL только одна? Кажется, что feedback() делает здесь что-то особенное? Кроме того, G_y_r имеет больше..

Краткое введение в методы-оболочки
Процесс выбора функций основан на алгоритме. Метод основан на жадном поиске . Он оценивает все возможные комбинации функций по заданному критерию оценки . И выводит комбинацию функций, обеспечивающую наиболее оптимальную производительность. Возможны три подхода. Выбор вперед

Наука о данных и торговля: две стороны одной медали
Кванты, пользующиеся большим спросом, - это просто специалисты по данным, которые применяют свои навыки в алгоритмической торговле. У специалистов по данным одна из самых сексуальных профессий 21 века. Доступность огромного количества данных и развитие искусственного интеллекта проложили путь к требованию огромного количества специалистов по данным. Гуру аналитики со всего мира предсказывают, что 2017 год будет более масштабным и многообещающим для специалистов по данным, поскольку..

Работа с графиками Кэли, часть 1 (машинное обучение)
О распределении собственных значений в семействах графов Кэли (arXiv) Автор: Матильда Лалин , Анвеш Рэй . Аннотация: Мы рассматриваем семейство неориентированных графов Кэли, связанных с нечетными циклическими группами, и изучаем статистику собственных значений в их спектрах. Наши результаты мотивированы аналогиями между арифметической геометрией и теорией графов. 2. Моноидный граф Кэли Артина (arXiv) Автор: Рэйчел Бойд , Рут Чарни , Роуз Моррис-Райт , Сара Риз . Аннотация:..

Управление политикой на рабочем месте с помощью искусственного интеллекта
Управление политикой на рабочем месте с помощью искусственного интеллекта Когда вы слышите слова «офисная политика», что приходит вам на ум? Все дело в том, чтобы «подлизываться» к нужным людям, «предать» и распространять вредные слухи? Если это так, вы захотите уйти от него как можно дальше! Однако, нравится вам это или нет, офисная политика — неизбежная часть работы в любой компании. Также возможно продвигать себя и свое дело, не ставя под угрозу собственные убеждения или убеждения..

Математические основы линейной регрессии
Линейная регрессия — это самый простой, но самый интуитивно понятный алгоритм машинного обучения, поскольку он позволяет легко сопоставить значение «прогноза» с математической основой. Я написал эту статью после того, как много прочитал о математике, лежащей в основе работы различных алгоритмов машинного обучения. После прочтения нескольких статей и документов по теме я попытался написать эту статью, используя всю информацию и знания, которые я получил. Я попытался сжать математику и..

Простое конкурентное обучение с Python
В этой статье дается подробное объяснение простого алгоритма конкурентного обучения, а также объясняются процессы и математические выводы, лежащие в основе этой модели машинного обучения. Большая часть информации взята из (Abbott & Dayan, 2005), который является отличным справочником, в котором освещаются предыдущие исследования и вдохновение по этому вопросу. Чего не хватает, так это практического понимания того, как работает этот процесс, поэтому мы реализуем алгоритм с помощью простой..

Разрушение когнитивных вычислений | Что это такое?
Разрушение когнитивных вычислений | О чем все это? — блог Джей Наир Когнитивные вычисления часто используется взаимозаменяемо с искусственным интеллектом, но это не совсем неправильно. Например, Школа бизнеса Слоана при Массачусетском технологическом институте определяет этот термин как систему, которая адаптивно использует лежащие в основе алгоритмы или обработку с учетом новых данных . Хотя это не всегда было горячей тенденцией. Настоящее диктует иное, при этом..

КАК СОЗДАТЬ ОТЛИЧНОЕ ПОРТФОЛИО ДЛЯ НАУКИ О ДАННЫХ
ВВЕДЕНИЕ :- Прошли те времена, когда люди просто просматривали резюме и решали, являетесь ли вы подходящим кандидатом на стажировку или работу. В технологическом секторе люди теперь видят общий профиль и проекты (портфолио) для отбора кандидатов, особенно для науки о данных. Но со временем образовательные компании начали предоставлять платные онлайн-проекты, поэтому почти каждый студент сейчас занимается проектами и стажировками (оплачиваемыми/неоплачиваемыми/добровольными). Кандидаты..

Проверка точности прогнозов ваших моделей
Написано Сабриной Херольд , Кристианом Глором и Стивеном Ван Винкелем в Tom Capital AG . В прогнозировании многое зависит от точности прогноза, который вы делаете. Есть несколько способов проверить точность вашей модели. Обычный способ измерить, насколько хорошо стратегия работала бы в прошлом, называется «бэк-тест». Большинство так называемых «бэк-тестов» разрабатываются людьми, которые очень хорошо справились со своей задачей за долгое время. К сожалению, чем лучше кто-то..

Новые методы анализа с использованием графовой сверточной сети, часть 4 (машинное обучение)
1. Определить выбор узла для сверточных сетей, ориентированных на классификацию с полууправлением (arXiv) Автор: Яо Сяо , Цзи Сюй , Цзин Ян , Шаобо Ли Аннотация: Сверточные сети графов (GCN) доказали свою эффективность в области полуконтролируемой классификации узлов путем извлечения структурной информации из графовых данных. Однако случайный выбор помеченных узлов, используемых GCN, может привести к нестабильной производительности обобщения GCN. В этой статье мы предлагаем..

Лучшее исследование гетерофильных графов, часть 1 (машинное обучение)
Краевая направленность улучшает обучение гетерофильных графов (arXiv) Автор: Эмануэле Росси , Бертран Шарпантье , Франческо Ди Джованни , Фабрицио Фраска , Штефан Гюннеманн , Михаэль Бронштейн . Аннотация: Графовые нейронные сети (GNN) стали де-факто стандартным инструментом для моделирования реляционных данных. Однако, хотя многие реальные графы ориентированы, большинство современных моделей GNN полностью игнорируют эту информацию, просто делая граф неориентированным. Причины..

Регуляризация L1 и L2 в машинном обучении: углубленный анализ
Регуляризация L1 и L2 в машинном обучении: углубленный анализ В машинном обучении высокая точность прогнозов может быть достигнута с помощью моделей, но они также могут иметь проблемы с обобщением новых данных из-за переобучения. Переобучение происходит, когда модель слишком сложна и настолько точно соответствует обучающим данным, что улавливает шум или несущественные детали наряду со значительными закономерностями. Регуляризация используется для противодействия переоснащению путем..

От плейлистов к прогнозам: понимание оттока в Sparkify
«В потоках нот, где мелодии переплетаются, Одни пользователи отдаляются, а другие всё равно выравниваются. Тем не менее, в приливах и отливах ритма все же возникают закономерности. Руководствуясь данными, мы прогнозируем следующий всплеск». Краткий: В этом проекте мы углубимся в набор данных Sparkify — коллекцию журналов активности пользователей из вымышленного сервиса потоковой передачи музыки. Наша цель — проанализировать поведение пользователей и построить модель, которая..

Руководство для начинающих по созданию и развертыванию контейнера для вашей модели ML
Наука о данных/развертывание Руководство для начинающих по созданию и развертыванию контейнера для вашей модели ML Веб-приложение, созданное с использованием Streamlit и развернутое на Heroku. Контейнеризация обсуждалась в моей предыдущей статье. Теперь давайте попрактикуемся. Мы будем развертывать модель машинного обучения под названием House Hunter. Это веб-приложение для прогнозирования цен на жилье, созданное с использованием Streamlit. Различные шаги, связанные с..

Самообучающееся руководство для всех, кто хочет изучить искусственный интеллект.
Нет, это не заголовок для клик-приманки. Красота области искусственного интеллекта в том, что она больше не ограничивается математиками и компьютерными науками. Конечно, это должно было быть ясно нам в 1958 году, когда Розенблатт впервые представил нам модель персептрона; мы должны были знать, что не должны ограничивать исследования в области искусственного интеллекта математиками и компьютерными учеными. У нас была задержка на 50 лет, но это нормально, давайте двигаться дальше...