Машинное обучение играет важную роль в секторе рекламных технологий с точки зрения эффективности и совершенства, которые оно может обеспечить в системе. Целью машинного обучения является разработка методов, которые могут автоматически обнаруживать закономерности в данных, а затем использовать обнаруженные закономерности для прогнозирования будущих данных или других результатов. Это также порождает инновационные продукты, о которых мы вскоре поговорим.

Повествование о данных меняется. Если раньше целью были большие данные, то сегодня основное внимание уделяется тому, чтобы сделать данные действенными. «Наука о данных - это дисциплина, позволяющая сделать данные полезными».

I. Прогностический анализ:

Проведение анализа исторических данных о транзакциях, поведении пользователей в Интернете и т. Д. Для прогнозирования будущих тенденций пользователей. Эта информация поможет вам принять меры в отношении рекламы. Например, если вы имеете дело с потенциальными клиентами, прогнозная аналитика может помочь вам определить клиентов, которые, скорее всего, намереваются совершить транзакцию, используя данные от существующих клиентов (называемых «двойниками»), чтобы вы не тратили ресурсы на плохих потенциальных клиентов.

Это также может помочь в выборе типов маркетинговых стратегий, необходимых для каждого клиента с известным намерением удержать клиента или увеличить его расходы.

Вот некоторые из наиболее часто решаемых задач прогнозного моделирования:

i) CLV: пожизненная ценность клиента - это прогноз чистой прибыли, относящейся ко всем будущим отношениям с клиентом.

ii) Прогнозирование кликов по объявлению: для прогнозирования вероятности клика, т. е. вероятности того, что пользователь нажмет на объявление, которое ему показано на партнерских веб-сайтах в течение определенного периода времени на основе данных журнала просмотра истории, данных о показах рекламы. , и пользовательские данные.

II. Алгоритмы ценовых ставок:

Давайте сначала посмотрим, что означает назначение ставок в реальном времени:

Ставки в реальном времени (RTB) - это средство, с помощью которого рекламный инвентарь покупается и продается на основе показа, через мгновенный программный аукцион, аналогичный финансовые рынки. При назначении ставок в режиме реального времени покупатели рекламы делают ставки за показ, и, если ставка выиграна, реклама покупателя мгновенно отображается на сайте издателя. Назначение ставок в режиме реального времени позволяет рекламодателям управлять и оптимизировать рекламу из нескольких рекламных сетей, предоставляя пользователю доступ к множеству различных сетей, позволяя им создавать и запускать рекламные кампании, определять приоритеты сетей и распределять проценты непроданных ресурсов, известные как заполнение. Источник: Википедия.

Цель состоит в том, чтобы найти оптимальную цену для назначения ставок в режиме реального времени для рекламного места для медийной рекламы.
Центральным вопросом при эффективной медийной рекламе является сопоставление кампаний с показами рекламы, что можно сформулировать как ограниченную оптимизацию проблема, которая максимизирует доход с учетом ограничений, таких как бюджетные лимиты и наличие запасов. Подробный алгоритм можно найти здесь: http://www0.cs.ucl.ac.uk/staff/w.zhang/rtb-papers/rtb-perf-bid.pdf

Общее руководство по алгоритмам динамического ценообразования: https://blog.griddynamics.com/dynamic-pricing-algorithms/. Этот метод использует новейший подход машинного обучения в действии, называемый обучением с подкреплением. Парадигма монетизации на эффективных параметрах (эксплуатация) и одновременного сокращения пространства поиска для лучших параметров (разведка) подпадает под RL.

III. Улучшить рекламный креатив:

Аудитория по-разному реагирует на рекламный креатив. Медиа, шрифт, призыв к действию - вот те творческие составляющие, которые заставляют людей щелкать или отключаться. В такой системе данные о прошлых объявлениях и прошлых кампаниях обрабатываются, чтобы точно определить, что будет работать для текущих усилий. С помощью этого приложения искусственного интеллекта бренды могут лучше понять, как все, от сообщений, шрифтов, цветов, изображений, размеров кнопок или форматов, влияет на общую эффективность кампании.

Применение машинного обучения в психологии потребителей путем соотнесения характеристик изображения с типами личности широко используется. Например, различные функции для изображений, включая оттенок, насыщенность, цветовое разнообразие, уровень детализации, количество людей, коррелируют с такими личностными качествами, как открытость, добросовестность, экстраверсия, покладистость и невротизм. Алгоритмы машинного обучения обнаружили, что взаимосвязь между типом личности и типом изображения может повлиять на интерес потребителя к продукту. Люди предпочитали не просто изображения, соответствующие их характеру. Они также сообщили о более благоприятном отношении и покупательских намерениях по отношению к этим брендам.

Повышение контекстной релевантности:

Помимо того, что ваше объявление хорошо спроектировано, оно должно запускаться на правильной платформе, с правильным таргетингом и в нужное время. Классификация настроений пользователей в режиме реального времени, когда они просматривают и соответствующим образом отображают рекламу, может быть одним из вариантов использования. Например, если вы просматриваете Instagram чаще, чем обычно, в определенный день или время, скорее всего, вы уже подверглись влиянию социальных сетей, и в этот период уязвимости шансы на конверсию высоки, если реклама показывается с высокой частотой. .

IV. Системы рекомендаций:

Этот класс алгоритмов попадает под релевантный рекламный таргетинг. Цель состоит в том, чтобы привлечь пользователей, которые будут иметь отношение к определенному продукту / бренду на основе симпатий и антипатий других подобных пользователей.

Позвольте мне дать определение широко распространенной современной техники, которая называется Глубокие и широкие системы рекомендаций, https://arxiv.org/pdf/1606.07792.pdf. (Настоятельно рекомендуется просмотреть бумагу). Входы в двухветвую нейронную сеть с комбинированной функцией потерь включают общие характеристики, такие как пол, возраст, местоположение, тип местоположения и т. Д., А также конкретные функции, такие как приложения, которые понравились пользователю. Цель состоит в том, чтобы узнать, как другие приложения нравятся этому пользователю.

Сеть здесь сочетает в себе преимущества запоминания и обобщения для рекомендательных систем.

V. Вероятностное разрешение ID:

Цель состоит в том, чтобы связать онлайн-идентификаторы между устройствами, назначив вероятности соединениям для записей внутри и между источниками данных.

Один из наиболее широко используемых подходов - сначала уменьшить пространство поиска с помощью общих функций, таких как данные наблюдений, обычно включая
идентификатор, временную метку, сетевой адрес и семантические данные,
например, демографические оценки для пользователя, и т.п.

Теперь из этих кластеров идентификаторов сформируем обучающие пары. Это двухэтапный подход, при котором пары сначала обнаруживаются с использованием «прокси» функций, таких как пространственно-временная локализация, например IP-адрес, дата и т. Д. Эти пары теперь либо помечены как «+1», если у них один и тот же хешированный адрес электронной почты. и «-1», если они этого не делают. Таким образом, мы можем разделить похожих, но не одинаковых пользователей на одной и той же территории.

Пожалуйста, обратитесь к статье для подробного объяснения: https://arxiv.org/pdf/1901.05560.pdf

VI. Обнаружение мошенничества:

По мере развития отрасли совершенствуются ее алгоритмы и сложности, ведущие к росту более изощренных видов мошенничества. Мошеннические данные и идентификаторы, оставшиеся незамеченными, могут привести к значительным потерям доходов, и их необходимо отфильтровывать на различных уровнях, два из которых упомянуты ниже:

Конец сбора данных: Использование моделей машинного обучения и метаэвристики для выявления шаблонов мошеннических поставщиков / идентификаторов данных. Например, если один и тот же идентификатор встречался несколько раз с одной и той же меткой времени, но в разных местах. Путем анализа данных на агрегированном уровне для поиска основных кластеров и обоснования высокого трафика.

Отказ от издателей: для выявления издателей-мошенников, которые генерируют незаконные клики, и их отличия от обычных издателей. Например, внедрение кликов означает повышение таких показателей, как CTR. Алгоритм машинного обучения определяет время установки, чтобы обнаруживать, среди прочего, роботизированные шаблоны, не связанные с человеком.

VII. Вероятностное моделирование:

Обратной стороной большого количества разреженных данных является целый ряд проблем, начиная с сложности интерпретации данных и заканчивая высокими затратами на сканирование и анализ данных во время выполнения. Ответ на эту проблему прост: выборка, но решение не так однозначно, поскольку требует, чтобы данные подверглись скрытому преобразованию, прежде чем мы сможем даже начать процесс выборки.

В этом блоге рассказывается о сложностях, связанных с неструктурированными данными большой размерности, и о том, как выполнять для них выборку: https://medium.com/@zeotapstories/the-zeotech-series-estimation-of-samples-part-i- f8822a64c2f5 .

Моделирование распределений:

Я не могу переоценить важность статистики как основы машинного обучения наряду с линейной алгеброй.

Распределения вероятностей: моделирование данных в одном из стандартных распределений вероятностей и использование его свойств для вашего варианта использования. Например, с историческими данными о покупках пользователей можно оценить вероятность того, что пользователь совершит следующую покупку, путем моделирования экспоненциального распределения.

Другой стандартный подход к расчету жизненной ценности клиента по его предыдущим покупкам с помощью модели отрицательного биномиального распределения (NBD). Оценка двух параметров, скорости покупки и общей стоимости, выполняется с использованием распределения Пуассона и экспоненциального распределения соответственно. Подробный алгоритм можно найти здесь: https://blogs.oracle.com/datascience/an-introduction-to-predictive-customer-lifetime-value-modeling

Следующий пост проливает свет на деловой аспект индустрии Adtech.

Использованная литература:

  1. Http://www0.cs.ucl.ac.uk/staff/w.zhang/rtb-papers/rtb-perf-bid.pdf
  2. Https://instapage.com/blog/machine-learning-in-advertising
  3. Https://arxiv.org/pdf/1606.07792.pdf
  4. Https://arxiv.org/pdf/1901.05560.pdf