Эффект Саманты: более пристальный взгляд на будущее ботов

В 2013 году Спайк Джонз выпустил инди-научно-фантастическую драму-ромком «Она».

Фильм следует по эволюционной траектории первой в мире операционной системы с искусственным интеллектом «Саманта».

Если не считать упоминаний Скарлетт Йоханссон, Саманта - мечта каждого разработчика: идеальный пример «настоящего» искусственного интеллекта (ИИ). Впечатляющий собеседник, она улавливает контекст, естественный язык, эмоции и здравый смысл.

Очевидно, что современные боты не совсем на уровне Саманты. В лучшем случае они способны предложить конкретные результаты через диалоговый интерфейс. В худшем случае они расстраивают ваш телефон об стену.

Поскольку технологии развиваются с молниеносной скоростью, можем ли мы приближаться к эпохе, когда мог бы существовать бот, похожий на Саманту?

Эмоционально интеллектуальные данные

Сегодняшний ИИ сочетает в себе символьную обработку (ИИ, использующий явные правила и логику) с машинным обучением таким образом, чтобы использовать их сильные стороны и уменьшить их слабые стороны.

Например, символьная обработка позволяет нам определять знания и поведение, которым может быть трудно научиться только на основе данных. Машинное обучение дополняет это, помогая системе адаптироваться к неожиданным ситуациям и новым концепциям.

Эта комбинация также обладает полезными свойствами, помимо ускорения процесса обучения. В будущем это может дать нам возможность более человечно взаимодействовать с ботами.

Потому что, несмотря на все свои заманчивые качества, машинное обучение по сути остается статистическим процессом. Это означает, что это отражение качества данных, от которых оно зависит.

Это благословение и проклятие. Чувствительность машинного обучения к характеристикам входных данных означает, что оно может легко научиться не тому, что было продемонстрировано на примере Tay, робота-расиста Microsoft.

Также утверждалось, что данные, которые отбираются для машинного обучения, часто отражают неосознанные предубеждения исследователя / разработчика (обычно молодых белых мужчин).

Чтобы приблизиться к способности Саманты к самоанализу и рассуждению, нам нужно запрограммировать какой-то искусственный эмоциональный интеллект в наших ботов: чтобы они могли отвечать

"Почему вы выбрали это?"

И даже сегодня относительно простые системы делают шаги к синтезу индивидуалистических ответов на вопросы.

Но в то же время обеспечение применения наших алгоритмов машинного обучения к данным хорошего качества в тщательно контролируемой среде - это самое близкое, что мы сможем подойти к машинам с эмоциональным интеллектом.

Семантическая сеть

Создатель всемирной паутины Тим Бернерс-Ли намного опередил время, когда он предложил семантическую паутину еще в 2001 году:

«Система, которая позволит компьютерам делать выводы из взаимосвязей между ресурсами в сети».

По сути, машины смогут связывать воедино идеи, концепции и факты, а не документы и страницы.

Это позволило бы подобным Саманте «компьютерным помощникам» «читать» информацию о нас и действовать от нашего имени: самостоятельно планировать наши встречи, организовывать наши поездки, бронировать столики на ужин. Привет, ПА нашей мечты.

Видение Бернерса-Ли уже было реализовано в определенной степени с помощью Сети знаний Google, которая потребовала от Google нанять тысячи людей для ввода явных правил в символическое представление обыденных знаний.

Это позволяет Google отвечать на вопросы с помощью небольшого блока структурированных данных (ниже), а не просто списка веб-страниц.

Технологии распознавания изображений также могут быть предшественниками семантической паутины; этот ИИ уже может распознавать ключевые слова, демографические данные, цвета и лица на изображениях.

Распознавание естественной речи

Способность понимать естественный язык - важнейшая составляющая успешного бота; с текстом, но также с распознаванием голоса.

В идеале бот должен иметь возможность достичь своей цели, автоматически заполняя диалоговые поля.

Siri, Cortana и Alexa еще не совсем соответствуют стандартам Саманты. Но ее деятельность в этой области не кажется недосягаемой.

Уровень ошибок распознавания речи падает примерно на 20% каждый год, а показатель Google недавно достиг всего 4,1% - почти так же точно, как у людей.

Эти улучшения можно отнести к ряду нововведений: множеству микрофонов, направленным лучам, сложной обработке шума и применению голосовой биометрии.

Анализ слуховой сцены - еще один многообещающий метод, который пытается разделить разные источники звука.

Распознавание голоса также извлекает выгоду из постоянно растущего объема данных, используемых для обучения статистических моделей с использованием методов машинного обучения: одна из них называется Глубокие нейронные сети (DNN).

DNN состоят из нескольких связанных слоев блоков обработки, вдохновленных нейронными сетями человеческого мозга.

Они могут классифицировать различные входные данные - изображения, последовательности слов, местоположения и речевые высказывания - по желаемым категориям, таким как слова, объекты и представление значений.

Контекст и абстракция

Тип рассуждения, который мы делаем, как люди, основан на понимании контекста и умозаключениях. Иногда это логично, но чаще всего они основаны на нашем общем знании мира: понимание того, что X, вероятно, приведет к Y.

Применительно к ИИ идеальный виртуальный помощник должен уметь предлагать альтернативы при столкновении с ограничениями, рассматривать различные возможности и понимать их достоинства:

Я: «Я хочу купить обувь у Мелиссы сегодня»

Бот: «Извини, Мелисса закрыта. Почему бы вам не попробовать Office, который похож и находится поблизости? "

В принципе, бот может узнать эти ассоциации методом проб и ошибок, но на это потребуется время: для каждого взаимодействия существует миллион различных вариантов.

Некоторые исследователи искусственного интеллекта думают, что ключ к компьютерному обучению по аналогии. Именно эта способность позволяет людям делать выводы из одной ситуации в другую, абстрагироваться от контекста и переходить на более высокий уровень понимания.

Боты, звучащие как человек

Эмоциональный диапазон и интонация в голосе Саманты все еще недоступны нам, но новые модели генерации речи, такие как Google WaveNet, способны создавать устрашающе убедительные искусственные голоса.

Больше никаких роботов Siri.

Естественно звучащий голос значительно увеличивает наше впечатление об интеллекте машины. Обратной стороной этого является то, что это вызывает ожидания от имени пользователя, что может привести к сбоям в разговоре и разочарованию.

И все мы знаем, насколько меньше терпения у нас с машиной, чем с человеком…

Независимо от того, сможет ли бот оправдать наши ожидания, мы предрасположены верить в машины, которые демонстрируют человеческое поведение (игра слов, каламбур, шутки, цитаты и эмоциональные выводы).

Это напоминает тест Тьюринга, в котором судья-человек вступает в разговор с другим человеком и машиной. Если судья не может отличить машину от человека, машина прошла испытание.

Insights

Может ли ИИ помочь нам в развитии «проницательности»?

Понимание, по своей сути, дает вам что-то новое и ценное. Однако, что наиболее важно, он помогает руководствоваться будущими решениями и действиями, что непросто для понимания программного обеспечения.

Мы узнаем понимание, когда видим его, но трудно определить или провести четкие границы вокруг него. А способность к пониманию включает в себя выявление закономерностей, отношений, корреляций.

Некоторые проекты машинного обучения уже затронули эту тему.

Например, Deep Mind Google (который также использует DNN) хорош для определения новых шаблонов на уровне сложности, который в одном случае (игра Go) превышает это человеческие существа. Но подобные техники работают только в том случае, если мы сообщаем машине, какова цель (в данном случае: победа в игре).

Только люди могут идентифицировать новые паттерны, которые интересны без заранее поставленной цели. Машина может определять закономерности, если понимает цель; только люди могут творчески определять закономерности.

С другой стороны, одна проблема, с которой сталкиваются люди, заключается в том, что, когда мы сосредотачиваемся на конкретной задаче, мы полагаемся на большой объем информации. Часть этой информации была получена бессознательно, через опыт; некоторые из них - благодаря сознательному обучению.

Но по мере увеличения объема информации количество, которое мы можем просеять, становится все меньше и меньше.

Итак, вот где у машин есть преимущество; они лучше справляются с огромными массивами данных.

Когда мы собираем и интегрируем эти данные, машины могут сотрудничать с нами в тех областях, где мы боремся.

И на данный момент большая часть цифровой информации находится в форме текста, то есть данные являются неструктурированными, а не структурированными данными, которые присутствуют в традиционных базах данных.

Текстовые данные

Это вводит нас в область машинного чтения, которая за последние 20 с лишним лет перешла из исследовательских лабораторий в коммерческие приложения.

Хотя все еще далекие от совершенства, автоматизированные методы понимания письменных текстов в последнее время быстро развиваются, чему способствуют новые разработки в области ИИ.

Вот пример.

Пациент входит в кабинет врача с редким заболеванием, с которым врач не знаком. Врач обращается к своему цифровому ассистенту, который сканирует все медицинские журналы, факты и информацию, когда-либо написанную о болезни, за секунды.

Затем он суммирует эту информацию и представляет ее врачу небольшими частями.

Maluuba, стартап по глубокому обучению, недавно приобретенный Microsoft, пытается разработать грамотную машину, которая может читать текст и учиться общаться на этой основе.

По сути, компьютеры могут просматривать, обрабатывать и резюмировать огромные объемы текста способами, о которых мы даже не могли мечтать.

И нам не нужно использовать высокотехнологичные языки компьютерного программирования или запросы к базе данных, чтобы сказать, что мы ищем: недавно разработанные системы также могут использовать естественный язык, чтобы задавать вопросы о тексте.

Это то, с чем мы уже до некоторой степени знакомы, благодаря вводу запросов в Google (автозаполнение делает это еще проще).

Все это делает ботов естественными наследниками этой традиции.

Последним удачным ходом стало то, что теперь у нас есть персонализация с помощью приложений, которые обучаются посредством взаимодействия.

Например, Replika разрабатывает идиосинкразические модели языка на основе сканирования прошлых сеансов чата, создавая информацию о предпочтениях и приоритетах пользователя.

И это приводит нас очень близко к территории Саманты.

Человеческий интеллект на базе искусственного интеллекта

Во время первой промышленной революции машины начали заменять ручной труд.

Сегодня, с появлением Индустрии 4.0, они также заменяют ручной умственный труд.

Практически любую рутинную задачу можно автоматизировать.

И, как продавцы и маркетологи, есть множество повседневных задач, от которых мы не прочь избавиться, например:

… ввод данных вручную, поиск тем и статей с идеями, просмотр бесконечных писем…

Передав их искусственному интеллекту «разуму», мы можем сосредоточить наши усилия на областях, в которых мы (как люди) преуспеваем и которые отличают нас (как людей) от машин.

Это было нашей отправной точкой в разработке GrowthBot, нашего бота по продажам и маркетингу, призванного помочь вам в развитии вашего бизнеса.

ИИ не может дать новое понимание; но это может помочь нам более эффективно задействовать наши творческие способности.

Мы можем смотреть на кучу данных, взаимосвязей и корреляций и думать, что видим что-то новое, что-то, что помогает нам лучше понять мир.

В конце концов, это то, в чем люди хороши.

Но действительно ли это понимание - простая догадка или нечто большее? Вот где мы можем дать автоматизацию вмешаться, чтобы исключить предположения и обеспечить прозрачность.

На наш взгляд, наиболее многообещающим аспектом ИИ является не способность воспроизводить реалистичного компаньона, такого как Саманта, а усиление нашего собственного человеческого интеллекта.

Спасибо за прочтение.

Если вам понравилась эта статья, не стесняйтесь нажимать кнопку хлопка 👏, чтобы помочь другим найти ее.

Первоначально опубликовано на blog.growthbot.org.