Узоры повсюду, согласны?

Уже некоторое время я веду интересные диалоги с ChatGPT, чтобы удовлетворить свои маленькие и мгновенные любопытства. Недавно, просматривая научную статью об анализе временных рядов биосигналов, мне в голову пришла мысль, и я не мог не задать ее:

Я: Шаблоны повсюду, вы согласны?

ChatGPT ответил:

«… узоры являются фундаментальным аспектом многих природных и антропогенных явлений. Закономерности можно найти во всем: от расположения клеток в живых организмах до движения планет в Солнечной системе, от структуры музыки до поведения финансовых рынков…».

Интересно, правда? Удивительно, но несмотря на то, что большая часть моих исследований связана с распознаванием образов, этот ответ и следующая последовательность мыслей застряли во мне достаточно долго, чтобы написать об этом. В следующей статье представлен более глубокий взгляд на наличие и значение паттернов в жизни человека. Кроме того, чтобы помочь студентам компьютерных наук лучше участвовать в обсуждении, также включены размышления о том, как современные вычислительные системы используют шаблоны использования. Итак, давайте погрузимся прямо в -

Почему важны шаблоны?

Согласно Википедии: «Узор — это закономерность в мире, в рукотворном замысле или в абстрактных идеях». Ранняя эволюция распознавания образов у людей была ограничена определением благоприятных и неблагоприятных вещей и условий, возможно, из-за ограниченных когнитивных способностей. Однако важным шагом в эволюции интеллекта стало развитие способности документировать и использовать более сложные паттерны, такие как положения планет, художественные паттерны, сезонные паттерны, поведенческие паттерны и т. д. Ниже приведены несколько важных примеров, когда распознавание паттернов способствовало развитию интеллекта. ранние цивилизации -

1. Научиться выращивать и готовить пищу: постоянная охота за едой, сложные циклы пищеварения, связанные с переработкой сырой пищи, и воздействие плохой пищи на здоровье требовали, чтобы ранние люди вкладывали много энергии, времени и когнитивных функций в удовлетворение потребностей Тело человека. Многие теории эволюции полагают, что развитие человеческого мозга в значительной степени способствовало нашему успеху в выращивании и потреблении легкодоступной, безопасной и легко усваиваемой пищи.

Это требовало развития способности распознавать благоприятные продукты питания, понимать их естественную среду обитания, развивать сельскохозяйственные процессы и животноводство, распознавать и прогнозировать сезонные колебания, понимать влияние окружающей среды и других живых организмов на производство, экспериментировать со стилями и комбинациями приготовления пищи; и список можно продолжить. По сути, большинство этих действий включало распознавание образов.

2. Создание социальных структур:защита от угроз и размножение имеют решающее значение для выживания любого живого вида. К счастью, людям удалось построить социальные структуры, которые многократно увеличили вероятность этих черт.

Однако успешное развитие этих социальных соглашений включало обмен идеями и эмоциями, установление протоколов и обеспечение их приемлемости, развитие торговых каналов и так далее. Хотя сегодня многие из нас воспринимают эти социальные структуры как нечто само собой разумеющееся, их эволюция требовала тщательного изучения повторений и аномалий в лежащих в их основе паттернах и принятия необходимых мер.

Сегодня мы используем нашу способность распознавать закономерности почти во всех аспектах нашей жизни, чтобы понимать сложные явления, предсказывать их результаты и соответствующим образом планировать действия. Большинство социальных, коммерческих и научных прорывов, которые привели нас в современный мир, связаны с процессом высокоточной идентификации, определения и использования различных паттернов. Например,

Открытие субатомного ядра стало возможным благодаря внимательному наблюдению за отклонением альфа-частиц (в знаменитом эксперименте Резерфорда с золотой фольгой).
Реализация широкомасштабной социально-экономической политики, такой как Pradhan Mantri Jan Dhan Yojana, подкрепляется подробным анализом данных, собранных из нескольких источников. Такая аналитика помогает государственным органам выявлять закономерности (указывающие на финансовую доступность, уровень доходов и доступ к банковским услугам) и, соответственно, планировать проекты внедрения в различных регионах страны.
Многие крупномасштабные научные исследования показали, что политическая стабильность и рост существующих демократий были движущим фактором более широкого внедрения демократических структур во всем мире.

Эти примеры могут создать впечатление, что понимание шаблонов — сложный процесс, и его следует использовать для решения крупномасштабных или сложных вручную задач. Однако на практике большинство человеческих способностей, которые мы можем классифицировать как интеллектуальные, проистекают из нашей способности использовать шаблоны.

Как мы распознаем закономерности?

Мы, люди, очарованы узорами. Большинство вещей, которые мы ценим и которыми наслаждаемся, таких как музыка, искусство, литература и т. д., основаны на реакциях нашего мозга на шаблоны (и сюрпризы в них). Исследования связывают способность распознавать закономерности с различными частями человеческого мозга. Однако общепризнано, что наш мозг запоминает шаблоны в основном по двум причинам — чтобы не запоминать необработанные данные и чтобы предсказать, чего ожидать дальше. Эти факторы относятся к двум различным аспектам обучения, обычно известным как репрезентативное обучение и вероятностное обучение соответственно.

Например, представление фрукта со сладким(выглядящим) вкусом, похожего на сферу странной формы, сочной текстуры и красной(выглядящей)кожицей с помощью символического представления (да, я говорю о яблоках), снимает бремя запоминания и использования всех этих деталей. С другой стороны, предсказание траектории укуса пчелы и сопоставление ее с более ранним случаем помогает нам уберечь себя от неприятного дня.

Однако вместо того, чтобы сосредоточиться на нейробиологии того, как наш мозг обрабатывает паттерны, мы перейдем к систематическому изучению паттернов, чтобы вести обсуждение в контексте вычислений.

Статистически мы изучаем паттерны как набор измеримых и идентифицируемых признаков, которые можно наблюдать в явлении. Обычно эти характеристики регистрируются как количественные (числовые) или качественные (категориальные) переменные с использованием соответствующих инструментов и методов сбора данных. Например, чтобы понять характер дождей в засушливом регионе, мы можем записывать такие характеристики, как скорость ветра, направление ветра, влажность, температура, плотность растительности и т. д. Такие выборки (каждая из которых содержит значения для всех характеристик) собираются в течение длительных периодов времени. (или через несколько итераций/экспериментов) и, в конечном итоге, используется для составления короткого списка соответствующих функций и их влияния на дождь.

Ниже приведены некоторые сложные примеры, чтобы подумать о том, как мы можем разбить шаблоны на функции. Дайте мне знать в комментариях, и я могу сказать, правильно ли вы их поняли.

а. Как определить, является ли ветер бурей?

б. Как отличить собаку от верблюда?

в. Как определить, здоров ли человек?

д. Как отличить гравитацию от трения?

Двигаясь дальше, мы можем сказать, что суть всей науки заключается в определении правильного набора характеристик, влияющих на целевые явления, тщательном учете этих характеристик и применении четко определенных процедур для описания лежащих в их основе паттернов.

На протяжении десятилетий исследователи использовали несколько алгоритмов и методов для изучения этих паттернов. Краткий график представлен ниже:

1950–1960-е годы: методы, основанные на выводах, основанные на принципах вероятностного и статистического анализа (например, байесовские сети), были наиболее используемыми методами в этот период.
1970-е: Исследователи начали изучать использование структурных свойств базовых данных для поиска пространственных закономерностей. В то время методы сопоставления шаблонов и сопоставления графов были успешными для достижения отличных результатов.
1980–90-е годы: хотя идея персептрона была озвучена в 1969 году, искусственные нейронные сети не считались полезными до тех пор, пока в этот период не были разработаны алгоритм обратного распространения ошибки, сети Хопфилда и сверточные нейронные сети. Это привело к внезапному увеличению использования вычислительных методов в задачах распознавания образов.
1990-е: Из-за ограниченности вычислительных ресурсов и данных для обучения исследователи начали изучать другие методы, которые можно было бы использовать для изучения закономерностей, не требуя большого количества данных или мощных компьютеров. Методы, основанные на нечеткой логике, машинах опорных векторов и деревьях решений, широко использовались в литературе в этот период.
2000-е: основанные на биологии методы, такие как генетическое программирование и алгоритмы оптимизации роя, помогли энтузиастам распознавания образов в этот период взглянуть на них по-новому.
2010-е – настоящее время: появление высокопроизводительных графических процессоров (GPU), библиотек параллельных вычислений и технологий хранения больших данных в течение первого десятилетия 21-го века стимулировало использование более глубоких архитектур нейронных сетей для задач распознавания образов. Основным преимуществом таких систем была их способность учиться непосредственно на данных, т. е. нет необходимости в явных шагах по извлечению признаков.

Хотя некоторые из более старых алгоритмов все еще используются из-за их более простой реализации и вычислительных преимуществ, большинство исключительных инноваций в области ИИ, таких как ChatGPT, управляются только системами глубокого обучения. Теперь, когда мы достаточно обсудили шаблоны, давайте перейдем к -

Как мы используем шаблоны?

Прежде чем мы обсудим их приложения, давайте сначала пройдемся по хорошо известным категориям шаблонов —

Геометрические узоры: они описываются с использованием пространственных характеристик, таких как форма, размер, ориентация и положение. Примеры включают узоры на изображениях, такие как круги, текстуры, кривые и т. д.
Статистические шаблоны. Эти шаблоны определяются с использованием статистических свойств собранных выборочных данных, таких как среднее значение, дисперсия и корреляция. Например, шаблоны в наборах данных, такие как тренды, кластеры и выбросы.
Структурные шаблоны: эти шаблоны можно использовать для представления иерархий, сетей и зависимостей. Такие шаблоны обычно используются при обработке текста для установления отношений между объектами, такими как предложения, абзацы, главы и т. д.
Временные паттерны: эти паттерны описываются с использованием признаков, которые включают некоторое ощущение последовательности, продолжительности и/или частоты. Такие шаблоны обычно актуальны при анализе временных рядов, когда мы пытаемся наблюдать тенденции, циклы и сезонные компоненты в основном распределении данных.
Поведенческие паттерны: эти паттерны описываются с использованием поведенческих особенностей, таких как действия, реакции и взаимодействия между людьми или объектами. Примеры включают модели поведения пользователей, такие как история просмотров, поисковые запросы и активность в социальных сетях.

Теперь, если мы можем предположить, что (а) доступны необходимые инструменты и методы для сбора качественных образцов, (б) доступны эффективные алгоритмы и (в) доступны достаточные вычислительные ресурсы; теоретически мы можем научиться распознавать любую закономерность в любом природном или антропогенном явлении.

Долгое время ученые полагались на ручные методы сбора данных, которые обычно ограничивались контролируемой средой (например, лабораториями). Поэтому было разработано огромное количество литературы об эффективности, применимости и этических аспектах различных методов сбора данных практически во всех проблемных областях. Однако из-за повсеместного внедрения вычислительной техники и разработки новых сенсорных технологий стало проще собирать признаки с повышенной точностью и скоростью. На самом деле данные доступны в таком изобилии, что новые проблемы, связанные с их хранением, поиском и обработкой, привели к возникновению новых областей исследований и подотраслей.

Теперь можно задаться вопросом, если все ингредиенты доступны, почему мы не можем научиться чему-либо и всему? Некоторые основные проблемы —

Не все шаблоны получены из одного и того же набора функций. Поиск правильных признаков для понимания паттерна обычно требует использования всего, что мы уже знаем о целевом явлении.
Могут быть дефекты в измерении/идентификации признаков. Важно записывать желаемые функции при контроле внешних факторов, таких как шум, смещение и т. Д.
Там может быть много функций, которые кажутся связанными с шаблоном. Из-за вычислительных ограничений мы можем не учитывать все функции, и определить, какие из них наиболее актуальны, сложно.
Не все функции полностью независимы друг от друга. Нам нужно проверить, есть ли какие-либо отношения между выбранными функциями и влияют ли эти отношения на наш шаблон.
Неясно, достаточно ли образцов для идентификации шаблона. Как решить, достаточно ли охвачены различные аспекты паттерна среди записанных семплов?
Как мы можем проверить наше понимание паттернов, т. е. правильно ли мы их изучили? Одна и та же стратегия проверки может работать не во всех ситуациях.
Мы должны постоянно обновлять наше понимание уже изученных шаблонов с течением времени. Однако непрерывная запись и обработка новых образцов может оказаться невозможной. Что, если новые образцы не собираются в контролируемой среде? Насколько новые образцы должны способствовать нашему нынешнему пониманию паттерна?
Как только мы поймем паттерн, мы должны использовать имеющиеся знания для понимания новых паттернов. Но разве, обладая общим набором признаков, необходима такая передача обучения?

Большинство существующих и текущих исследований в области статистики и искусственного интеллекта сосредоточены на поиске решений этих проблем. Я попытаюсь обсудить некоторые из принятых в настоящее время решений этих проблем в другой статье позже. Давайте завершим эту дискуссию одним последним вопросом -

Если шаблоны так полезны, можем ли мы их создать?

Давайте начнем с очень распространенного варианта использования — написания электронных писем. Требуется ли распознавание образов? Да, это так. Действительно, написание электронного письма, которое кто-то еще может понять, как задумано, требует развития расширенного набора следующих способностей:

Определите и напишите символы и символы общего языка,
Понимать и использовать синтаксические правила (как формируются предложения) и семантические структуры (какие предложения имеют смысл) языка,
Знать и использовать интонации, знаки препинания и литературные стили,
Понимать и сохранять контекст общения,
Прогнозировать и адаптироваться к эмоциональному и интеллектуальному фону получателя.
Используйте соответствующее устройство и программное обеспечение.

Все эти шаги основаны на искусственных шаблонах, которые упрощают обмен идеями и информацией между нами. Создание таких шаблонов всегда помогало нам создавать новые знания и передавать их следующим поколениям. Например,

Известно, что все уважаемые художники и историки сохраняют определенный стиль во всех своих работах, что облегчает передачу их идей более широкой аудитории.
Большинство успешных компаний учитывают приспособляемость и реакцию целевой аудитории на связанные модели пользователей при внедрении новых продуктов.
Большая часть современной науки основана на методологиях исследования, абстрагированных от основных достижений в соответствующих областях.

И мы можем продолжать перечислять больше.

Заключение

Суть в том, что шаблоны повсюду! Как люди, сознательно и подсознательно, мы так хорошо учимся и создаем новые, что во многом на них полагаемся. С развитием наших возможностей обработки данных и появлением новых рубежей в области вычислительного интеллекта мы теперь можем создавать машины (компьютеры, роботы и т. д.), способные лучше, чем когда-либо, изучать эти закономерности. Как поколение, мы можем считать себя достаточно удачливыми, чтобы быть частью этой новой революции.

Пища для размышлений

Когда машины начали выполнять работу, требующую ручной силы, люди стали слабее, чем раньше (в целом). Когда машины начнут помогать нам распознавать закономерности, не потеряем ли мы способность работать с ними?
Если машины смогут идентифицировать сложные шаблоны, они будут лучше выполнять большинство задач, требующих выполнения действий на основе шаблонов, таких как транспортировка, контроль качества, обучение и т. д. Какова будет роль людей в таком обществе?
Весь ли человеческий интеллект основан на распознавании образов? Если машины значительно лучше нас распознают образы, есть ли у нас какие-либо другие навыки/разум, которым эти машины не могут обучиться?
Достаточно ли мы осведомлены о шаблонах, изучаемых машинами прямо сейчас? Гарантируем ли мы, что они используются осторожно?

Дай мне знать в комментариях! И если вы узнали что-то новое из этой статьи, пожалуйста, поделитесь этим с другими.