Две минуты НЛП — Заставить модели большого языка рассуждать с помощью подсказок по цепочке мыслей

Быстрая разработка и цепочка мыслей, побуждающая к арифметическим, символическим и здравым рассуждениям.

Здравствуйте, любители НЛП! Когда большие языковые модели стали способны выполнять задачи с небольшим и нулевым числом шагов, мы узнали, что разные подсказки дают разные результаты, и заговорили о «разработке подсказок». Сегодня мы видим, как разные подсказки приводят к очень разной производительности во многих логических задачах, таких как арифметические, символические и логические рассуждения. Наслаждаться! 😄

Цепочка мыслей

Масштабирование больших языковых моделей улучшило их производительность в различных задачах НЛП. Однако не все задачи претерпели одинаковые улучшения, действительно, самые большие модели в настоящее время борются с определенными задачами рассуждения, такими как математические задачи со словами, символьные манипуляции и рассуждения на основе здравого смысла.

Одна из интерпретаций этого вывода заключается в том, что большие языковые модели успешно выполняют системные задачи 1, которые быстро и интуитивно выполняются людьми. Однако задачи системы-2 требуют медленного и обдуманного мышления (часто в несколько шагов) и включают, среди прочего, логические, математические и логические задачи. Языковые модели плохо справляются с задачами system-2 даже при масштабировании до сотен миллиардов параметров, достигая плоских кривых масштабирования (т. е. простое увеличение масштаба модели не приводит к существенному приросту производительности).

Оказывается, подсказка языковых моделей с цепочками мыслей, аналогичная тому, как человек рассуждает, значительно улучшает его производительность в задачах рассуждения, преодолевая ранее наблюдавшиеся плоские кривые масштабирования.

Интуиция состоит в том, что цепочка рассуждений позволяет языковым моделям разлагать многоэтапную задачу на промежуточные этапы, которые решаются по отдельности, вместо того, чтобы решать всю многоэтапную задачу за один прямой проход.

Вот пример подсказки цепочки мыслей:

Преимущества подсказок по цепочке мыслей

Подсказка по цепочке мыслей имеет несколько привлекательных свойств:

Позволяет модели разлагать многоэтапные задачи на промежуточные этапы, а это означает, что дополнительные вычисления могут быть выделены задачам, требующим большего количества этапов рассуждения.
Предоставляет интерпретируемое окно в поведение модели, предлагая, как она могла прийти к определенному ответу, и предоставляя возможности для отладки, где путь рассуждений пошел не так.
Может использоваться для таких задач, как математические задачи, символьные манипуляции и рассуждения на основе здравого смысла, и применим к любой задаче, которую люди могут решить с помощью языка.
Может быть легко выявлен в достаточно больших готовых языковых моделях, просто включив примеры цепочек мыслей в образцы подсказок с несколькими выстрелами.

Результаты эксперимента

Для шести задач на рассуждения, в которых стандартная подсказка имеет плоскую кривую масштабирования, подсказка по цепочке мыслей приводит к резкому увеличению кривых масштабирования для достаточно больших языковых моделей.

Эксперименты проводились с двумя большими языковыми моделями: LaMDA и PaLM.

Арифметические рассуждения

Тестирование LaMBDA и PaLM с помощью простых арифметических вопросов, подсказка по цепочке мыслей дает немного лучшие результаты.

Основные преимущества проявляются, когда моделям задаются более сложные арифметические вопросы, например, из наборов данных MultiArith и GSM8K.

И LaMBDA, и PaLM значительно улучшили подсказки по цепочке мыслей по сравнению со стандартными подсказками.

Символическое рассуждение

Для символического рассуждения рассмотрите задачи конкатенации последней буквы, обратного списка и подбрасывания монеты, показанные на следующем рисунке.

Опять же, все они значительно улучшаются, используя цепочку рассуждений.

Здравый смысл

Наконец, рассмотрим следующие примеры задач на рассуждение на основе здравого смысла: контроль качества здравого смысла, контроль стратегии, понимание даты и понимание спорта.

Вот их производительность со стандартом и подсказкой цепочки мыслей.

Выводы и дальнейшие шаги

В этой работе подчеркивается, что стандартные подсказки лишь ограничивают возможности больших языковых моделей. Какие другие методы подсказки могли бы расширить круг задач, которые могут решать языковые модели?

Возможные следующие шаги:

Узнать о модели PaLM;
Узнайте о стратегиях декодирования языковых моделей.

Спасибо за чтение! Если вы хотите узнать больше о НЛП, не забудьте подписаться на NLPlanet в Medium, LinkedIn и Twitter!