10000 электрических овец в книге, созданной искусственным интеллектом

Доктор Эрнесто Диас-Авилес, соучредитель и генеральный директор Libre AI

Мы рады сообщить, что книга « Сновидения об электрических овцах » доступна на Amazon. Все гонорары будут использованы для поддержки наших инициатив по повышению грамотности в сфере ИИ / машинного обучения.

В книге содержится 10000 овец, нарисованных искусственным интеллектом на основе машинного обучения (AI / ML).

Машина, получившая название Laila, была обучена с использованием десятков тысяч набросков овец, сделанных реальными людьми [1]. Через некоторое время Лайла начала мечтать об овцах и создавала рисунки, которые бывают такими же хорошими (или такими же плохими и схематичными), как и те, что нарисованы людьми :)

«Мечтают ли андроиды?»
- Филип К. Дик, Андроиды мечтают об электрических овцах?

От искусственного интеллекта к искусственному интеллекту

Более 12 лет назад Amazon ввела термин искусственный искусственный интеллект для обозначения процессов, передающих задачи на аутсорсинг людям, особенно те задачи, которые компьютеры плохо справляются (или были?), Например, для идентификации объекты на фотографии, написание коротких обзоров продуктов, расшифровка подкастов, просмотр короткометражного фильма и затем описание эмоций, которые он вызывает.

Краудсорсинг возник как новая форма труда по требованию [2], а Amazon Mechanical Turk (MTurk) предоставил механизмы, позволяющие использовать возможности глобальной рабочей силы для выполнения масштабных задач. Именно в этом контексте родился проект Аарона Коблина Овечий рынок.

Овечий рынок - это коллекция из 10 000 овец, созданная рабочими Amazon’s Mechanical Turk. Каждому рабочему платили 0,02 доллара (USD) за выполнение HIT (задачи человеческого интеллекта): «нарисовать овцу лицом влево».

Возвращаясь к 2018 году, AI / ML в настоящее время демонстрирует впечатляющую производительность в таких областях, как компьютерное зрение и обработка естественного языка. Ожидается, что AI / ML повлияет на многие отрасли, помогая нам в наших утомительных задачах или занимая нашу работу, или что-то среднее между ними.

Эта книга представляет собой эксперимент, который иллюстрирует, как определенные задачи краудсорсинга, например рисование овцы с использованием искусственного искусственного интеллекта HIT от MTurk, теперь могут выполняться машинами, достигающими производительности, близкой к человеческому уровню, что потенциально может начать отнимать эти микроплатежи от работников-людей. Рабочие, которые, как это ни парадоксально, помогли машинам учиться на наборах данных, созданных путем выполнения микрозадач.

Например, при создании этой книги машина, модель AI / ML, обучается с использованием набора данных набросков овец, полученных от реальных людей [1], а затем может самостоятельно создавать оригинальные рисунки овец.

Как научить машинку рисовать (электрических) овец?

Мы, люди, несовершенно изобретательно рисуем овец, помните проект Овечий рынок? или взгляните на несколько десятков тысяч каракулей овец, сделанных реальными людьми в игре The Quick, Draw! эксперимент.

«… Если бы каждый человек нарисовал идеальную овцу, все они были бы одинаковыми, и это был бы ужасный проект… это небольшие вариации, которые придают персонажу и делают его интересным». - Аарон Коблин, проект «Овечий рынок».

Все такие варианты и разнообразие, которые люди выражают при рисовании овцы, было бы чрезвычайно сложно уловить в программе, написанной на Python, Java или C ++.

AI / ML спешат на помощь. Если вы хотите научить машину рисовать овцу с помощью AI / ML, вы не говорите ей рисовать голову, а затем тело с шерстью, лицом и глазами. Вы просто покажете ему тысячи и тысячи рисунков овец, и в конце концов машина научится и все уладит. Если он продолжает терпеть неудачу, вы не переписываете код. Просто продолжайте тренировать это.

Для этой книги машина под названием Laila была обучена с использованием десятков тысяч каракулей овец, сделанных реальными людьми [1]. Через некоторое время Лайла начала мечтать об овцах и создавала рисунки, которые бывают такими же хорошими (или такими же плохими и схематичными), как и те, что нарисованы людьми :)

Зачем, зачем, зачем мы это делаем?

Ответ на этот вопрос многогранен.

  • Конечно, эксперименты с AI / ML, но также и исследование создания чего-то осязаемого, книги, созданной машиной. Посмотрим, станет ли он бестселлером :)
  • Сравните разрушение краудсорсинга и нынешнюю волну подрывов в области ИИ / машинного обучения.
  • l’art pour l’art и l’ia pour l’ia

Почему овцы?

Мы живем в Ирландии уже пару лет, и вы можете найти больше овец, чем людей на этом прекрасном острове :), милые овечки вдохновили электрических овец, о которых мечтала Лейла, которые тоже сделаны в Ирландии с ❤

Что вы делаете с книгой, содержащей 10000 электрических овец?

Возможности безграничны :), вот несколько идей:

  • Вы можете посчитать этих электрических овец способом помочь вам заснуть, если вы достигнете 10K, но все еще не спите, просто начните заново со случайной страницы
  • Вы можете использовать книгу как книжку-раскраску для себя или своих детей (это то, что мы делаем;))
  • Вы можете изучить навыки рисования машин
  • Вы можете подарить его своему фанатичному другу и позволить ему решить, что с ним делать.
  • Вы можете попрактиковаться в резке ножницами и разрезать 5К овец (страницы печатаются с обеих сторон)
  • Вы можете купить вторую копию, а затем продолжить практиковать свои навыки резки ножницами и разрезать другую овцу 5K.
  • Вы можете использовать страницы в качестве обоев (патент заявлен)
  • Не стесняйтесь добавлять новые идеи в свои комментарии ниже;)

Как мы это сделали?

Мы используем алгоритм AI / ML под названием Generative Adversarial Networks (GAN) [3]. Сети GAN реализуются системой двух глубоких нейронных сетей, соревнующихся друг с другом в рамках игры с нулевой суммой. Два игрока в игре называются Генератором и Дискриминатором.

Генератор, как следует из его названия, генерирует кандидатов, а Дискриминатор оценивает их. Целью обучения генеративной сети является создание новых синтезированных экземпляров, которые кажутся происходящими из набора реальных экземпляров, тогда как для дискриминатора его цель - различать истинные и сгенерированные экземпляры.

Вы можете представить себе художественную аналогию отношений ученик-мастер, где с пустого холста ученик (Генератор) будет создавать картины, которые мастер (Дискриминатор) будет судить на основе своего опыта и предыдущих знаний как настоящие произведения искусства или нет. .

Ученик будет становиться все лучше и лучше на основе отзывов мастера, пока не достигнет уровня, на котором мастер не сможет различать работу своего ученика и хорошее произведение искусства.

Следующий рисунок иллюстрирует наш подход:

В двух словах:

  • Набор данных. В качестве обучающего набора мы используем набор данных овец из The Quick, Draw! эксперимент.
  • Архитектура. Мы используем Deep Convolutional Generative Adversarial Networks или DCGAN [4] для реализации нашего подхода.
  • Инструменты глубокого обучения. Мы используем Keras с бэкэндом TensorFlow для реализации модели и JupyterLab для прототипирования.
  • Модели. После обучения моделей Генератора и Дискриминатора мы сохраняем их независимо.
  • От случайного шума до овец. Затем мы используем Генератор для создания рисунков овец из случайного шума. Результаты такие же хорошие (или такие же плохие и отрывочные), как и у людей;)

Более подробную информацию о том, как мы это сделали, можно найти в этом посте: https://medium.com/@libreai/draw-me-an-electric-sheep-9a3e0b5fe7d5

~ Fin ~

Об авторе
Dr. Эрнесто Диас-Авилес является соучредителем и генеральным директором Libre AI . Twitter: @vedax

Примечания

  • В статье Дэвида Ха и Дугласа Экка Нейронное представление эскизов (2017). Https://arxiv.org/abs/1704.03477, рекуррентная нейронная сеть (RNN) используется для построения рисунков на основе контуров, а не пикселей. Вместо этого мы использовали GAN, так как мы думаем, что это помогает объяснению, основанному на аналогии ученика-мастера.
  • Наша модель использует информацию на уровне пикселей для изображений для обучения и создания новых экземпляров. Чтобы улучшить качество изображения, мы конвертируем выходные растровые изображения в векторную графику (SVG) с помощью Potrace.

использованная литература

[1] Быстро, нарисуй! Набор данных овец. Https://quickdraw.withgoogle.com/data/sheep; данные предоставлены Google, Inc. по международной лицензии Creative Commons Attribution 4.0.

[2] Джефф Хау. 2016. Рост краудсорсинга. [Https://www.wired.com/2006/06/crowds/].

[3] Ян Дж. Гудфеллоу, Жан Пуже-Абади, Мехди Мирза, Бинг Сю, Дэвид Вард-Фарли, Шерджил Озаир, Аарон Курвиль и Йошуа Бенджио. 2014. Генеративные состязательные сети. В материалах 27-й Международной конференции по системам обработки нейронной информации (NIPS’14) [https://arxiv.org/abs/1406.2661]

[4] Алек Рэдфорд, Люк Мец, Сумит Чинтала. 2015
Обучение представлению без учителя с помощью глубоких сверточных генерирующих состязательных сетей. [CoRR abs / 1511.06434]