«Материаловедение» не имеет таких вызывающих тревогу ассоциаций, как, скажем, «аэрокосмическая промышленность» или «робототехника». Какая жалость! Каменные орудия - с деревянными древками - были ключом к подъему обезьяны с довольно недоразвитыми зубами и когтями на вершину пищевой цепи. Металлургия дала нам медь, бронзу и железо - и соответствующие волны завоеваний и поселений (в течение как минимум 10 000 лет существовало сильное давление отбора в пользу обществ, которые позволяли хотя бы нескольким ботаникам возиться с рудой и огнем).

Дополнительное количество углерода и упорное стремление к совершенствованию производственного процесса дали нам высококачественную сталь, которая послужила толчком для промышленной революции. Полупроводники внутри процессора, лежащего в основе ноутбука, о котором я пишу, демонстрируют нашу способность манипулировать материей в нанометровом масштабе ... и тем не менее, такие достижения бледнеют по сравнению с изощренностью композитных материалов в клешне креветки (выдерживая огромные размеры). силы без необходимости в металлах), или эффективность (95%!) элегантности сбора электронов, скрытой в зеленой красоте хлорофилла. Жизнь превосходна в создании объектов макро-масштаба с наноразмерной структурой - мы этого не делаем.

Власть человека над материей в определенном масштабе очевидна - вы можете видеть наши города с орбиты, и мы изменили даже состав нашей атмосферы. Однако наша способность манипулировать материей в мельчайших масштабах остается довольно ограниченной. Как мы увидим, изменение того, что возможно в этой области, вполне может стать одним из величайших вкладов ИИ.

В течение 20 века физики и химики использовали новое понимание атома сначала для исследования структуры важных молекул, а затем, постепенно, для того, чтобы научиться собирать их из более простых ингредиентов. Создание более крупных молекул из более простых - синтез - изменил нашу жизнь. Пластмассы - отличный пример - у вас, вероятно, есть некоторые полимеры в вашей одежде, но вы также изолируете проводку в вашем доме, предотвратите порчу продуктов в холодильнике и защитите ваш экстерьер от атмосферных воздействий (даже для вашей красивой деревянной мебели часто используются клеи на основе пластмасс). Хемосинтез также использовался для создания более сложных молекул, просто посмотрите в шкафчик с лекарствами - например, аспирин или сальбутамол, активный ингредиент ингаляторов вентолина - отличные лекарства, которые сейчас невероятно дешевы в производстве.

Именно здесь мы начинаем обнаруживать некоторые важные ограничения: мы можем синтезировать такие простые молекулы, но для более сложных - инсулина, антибиотиков - мы должны «нанимать» помощников. Инсулин, например, варят в биореакторах с использованием генетически модифицированных дрожжей или бактерий: поскольку мы не можем понять, как это сделать, мы скопировали и вставили последовательность ДНК для человеческой версии в крошечных существ, которые затем взбивают ее. промышленные объемы (своего рода пивоваренный процесс высокого класса, мало чем отличающийся от пивоварения). Хотя эти лекарства были огромным благом, их открытие и производство также подчеркивают наши слабые стороны:

  • Необходимо найти новые антибиотики - они не разработаны. Например, ключевым шагом в массовом производстве пенициллина стало открытие необычайно легко выращиваемой плесени на дыне в Пеории, штат Иллинойс. Как бы мы ни восхищались кропотливым глобальным поиском, в ходе которого была обнаружена дыня как надежный, повторяемый процесс создания новых лекарств, возможно, мы могли бы его улучшить.
  • Какими бы услужливыми ни были наши крошечные работники, живущие в биореакторах, их виртуозность в создании больших молекул ограничивается тем, что можно описать последовательностью ДНК (которая сама по себе должна быть достаточно короткой, чтобы мы могли успешно синтезировать). Это исключает почти всю таблицу Менделеева.
  • Даже ограничиваясь «вещами, которые могут производить дрожжи», нам все равно необходимо разработать последовательность ДНК или набор последовательностей, которые дадут желаемый результат. ДНК «экспрессируется» или «исполняется», превращаясь в белки, которые должны складываться в окончательную функциональную форму. Получить правильную последовательность для надежного складывания результата - непростая задача.

Мы открыли законы, которые с необычайной точностью описывают поведение материи на мельчайших масштабах - квантовая механика - и поэтому, в принципе, мы должны иметь возможность конструировать и строить новые структуры. в мельчайших масштабах по желанию. Однако, отвечая даже на сравнительно простой вопрос о новом веществе - «Какова его температура кипения?» остается крайне затруднительным. Вместо того, чтобы разрабатываться с нуля, новые материалы часто находят путем перебора. Помимо поиска подходящего материала, фактическое производство его в промышленных количествах - это огромная проблема: коммерциализация новых материалов занимает от 5 до 15 лет. Даже в корпорации Intel с 50-летним опытом, где мы делаем устройства с изысканной наноструктурой, требуется огромное здание с ценой от 10 до 11 цифр, чтобы выполнить свою работу.

Одна структура, которая иллюстрирует как сложность, так и потенциал, - это углеродная нанотрубка, лист из атомов углерода, связанных гексагональным узором и свернутых в трубку со стенками толщиной всего в 1 атом. Трубки этой формы обладают многими интересными тепловыми и электрическими свойствами, но их механическая прочность показывает их потенциал: кабель из углеродных нанотрубок с площадью поперечного сечения 1 мм2 может выдержать вес 6 тонн (на фото довольно грубая нить, подвешивающая два пикапа!), прочность на разрыв более чем в 300 раз выше, чем у высокоуглеродистой стали. Почему мы не видим этот чудо-материал повсюду? Две причины:

Расходы

Поскольку углеродные материалы занимают 4-е место по распространенности во Вселенной, мы можем наивно ожидать, что они будут дешевле, чем сталь (которая в основном состоит из железа, а содержание элемента примерно на 1/4 меньше, чем у углерода). Хотя цена углеродных нанотрубок упала с 1600 за грамм в 2000 году (примерно в 40 раз дороже золота) до 1 доллара в 2018 году (примерно 1/40 цены золота), это замечательное улучшение, но все же оставляет нам на 3 порядка меньше цены на сталь (около 1 доллара за килограмм). «Дешевле золота» - не очень требовательная планка!

Качественный

В 2007 году самые длинные трубки были около 1,8 сантиметра в длину. К 2013 году самые длинные трубки все еще составляли всего 50 сантиметров.

Огромное падение цены связано с героическими усилиями экспериментаторов по улучшению синтеза углеродных нанотрубок. Так почему же мы не можем «просто» применить квантовую механику к проблеме получения этого материала и пропустить все эти утомительные эксперименты? Разве эти законы не должны дать нам рецепт, который нам нужен?

К сожалению, моделирование с использованием этих законов требует исключительно больших вычислительных затрат (по крайней мере, на классических компьютерах). К счастью, физики нашли элегантную уловку: модели машинного обучения можно рассматривать как аппроксиматор функций - способ взглянуть на сложный математический элемент и предложить более дешевую альтернативу, которая поможет нам в пределах уса («в пределах эпсилона») от правильного ответа. Большинство из нас думает, что машинное обучение требует больших вычислительных мощностей: физики думают об этом как о невероятно выгодном предложении, которое позволяет им точно моделировать химические реакции по невысокой цене в 1% от стоимости. «толстого» квантового моделирования. Нам не нужно знать точные параметры кривой спроса и предложения для квантового моделирования, чтобы спрогнозировать соответственно резкое увеличение использования этих симуляций, поскольку становятся доступными более дешевые (но все же достаточно точные) симуляции на основе машинного обучения. Моделирование этого типа уже позволило ученым, работающим в Национальном исследовательском центре Канады, предсказать свойства углеродных структур в беспрецедентном масштабе, что стало ключевым шагом к расширению промышленного использования углеродных нанотрубок и связанных с ними структур.

Более дешевое моделирование важно как шаг вперед для понимания поведения больших квантовых динамических систем, лежащих в основе материаловедения, фармацевтики, вычислений и производства энергии. Кроме того, он также помогает в разработке или открытии полезных молекул и, что особенно важно, в разработке методов синтеза, необходимых для их создания. На момент написания, например, разработка новых терапевтических молекул - новых лекарств - часто включает работу с довольно большими молекулами, содержащими тысячи атомов: аминокислоты и белки - это язык молекулярной биологии, в сотни раз больше и сложнее, чем дружелюбный маленький ребятам нравится алкоголь или кофеин.

Один из подходов к открытию новых лекарств - создать обширную молекулярную библиотеку, а затем использовать роботов для проверки этих молекул на терапевтический потенциал. Думайте о лекарственной мишени - `` рецепторном участке '' (возможно, служащем привратником на поверхности клетки) как о сложном замке, а о молекулярной библиотеке как о обширной коллекции ключей - сосудах со старыми реликвиями из дворовых продаж, господин уже известно, что ключи открывают множество замков, и новые творения, созданные в простой надежде, что их создатель однажды найдет соответствующий замок (да, химики создают вариации за вариациями интересных соединений, надеясь, что они могут оказаться полезными). Процесс проверки - это попытка ключ за ключом в этом заманчивом замке, поиск чего-то, что плавно поворачивается, и отбрасывание тех, которые не подходят или заклинивают - или открывают слишком много замков, которые мы бы предпочли не трогать. Представьте, что вы пытаетесь таким же образом создать любой другой новый продукт! Эксперты действительно пытаются вручную размещать атомы для создания новых лекарств, но само существование процессов роботизированной проверки на наркотики должно предупредить читателя о том, что это трудная задача.

Если бы только мы могли построить достаточно точное (воплощающее законы квантовой механики) моделирование, способное работать при разумных затратах, можно было бы работать по-другому. Вместо того, чтобы определять раствор в форме молекулы, исследователь должен определить желаемые свойства (возможно, лекарство должно связываться с одним конкретным «рецепторным» сайтом на внешней стороне клетки, но не со множеством подобных рецепторов и быть восприимчивыми к возможному расщеплению на нетоксичные метаболиты ферментами печени) и позволяет использовать форму машинного обучения, называемую обучением с подкреплением, для создания собственной молекулы. Эта форма машинного обучения используется для обучения политик выполнению ряда действий в определенной среде (обычно моделируемой для сокращения затрат и времени разработки), чтобы добиться прогресса в достижении конкретной цели. Обучение работает, потому что политика регулируется алгоритмом оптимизации, который пытается максимизировать «вознаграждение». Например, изменения в молекуле, которая увеличивает токсичность, приведет к отрицательному вознаграждению, в то время как изменения, которые увеличивают специфичность по отношению к целевому рецептору, будут привлекать положительное вознаграждение. Эта форма машинного обучения создала политики (модели), которые побеждают всех противников в таких играх, как го и шахматы, а также успешно справляются с более легкомысленными задачами, такими как использование рук роботов для управления кубиками или обучение самоуправляемых автомобилей.

К сожалению, поиск правильной молекулярной структуры - это только первый шаг: затем нам нужно разработать процесс создания этой молекулы, и это и есть синтез. Мы рассматривали своего рода самоуправляемую химию для молекулярного дизайна, но мы также могли бы получить огромную выгоду от автоматизации дизайна синтеза, а выяснение шагов, необходимых для производства конкретной молекулы, - сложный бизнес, который так далеко оказался устойчивым к автоматизации. Насколько важна способность разработать процесс синтеза? Ключевым компонентом «зеленой революции», позволившей расширить сельское хозяйство, чтобы прокормить современное население, является использование искусственных удобрений. Среди них особенно важен аммиак - он нужен растениям как источник азота. Это может показаться странным - наша атмосфера в основном состоит из азота, так что не должны ли они просто вытащить его из воздуха? К сожалению, азот, которым мы дышим (N2), крайне инертен, и растения до сих пор не выработали необходимый химический состав. Такова сложность, что люди, придумавшие последовательность шагов - процесс Габера-Боша - получили Нобелевскую премию. Однако этот процесс чрезвычайно энергоемкий, на него приходится более 1% глобального потребления энергии в мире и на его долю приходится около половины азота в тканях типичного человека (настолько велико было его вклад в сельское хозяйство).

То, что синтез даже очень маленькой и простой молекулы, такой как аммиак, может быть чрезвычайно трудным (растения по-прежнему не могут этого сделать, и даже гениям химии человека необходимо использовать очень высокие температуры и давления), должно убедить вас в потенциальных преимуществах автоматизации Дизайн синтеза и влияние процесса Габера-Боша должны прояснить огромную социальную ценность таких инноваций. Пример простых почвенных бактерий, которые случайно фиксируют азот при температуре и давлении окружающей среды, сильно отличающихся от промышленного процесса при высоких температурах и высоком давлении, показывает нам, насколько лучше мы могли бы стать.

Соединение потенциала машинного обучения с одной из величайших проблем современности - удовлетворение растущего глобального спроса на энергию при также сокращении чистых выбросов CO2 - более совершенные способы производства, хранения и передачи энергии зависят от материалов. наука. Другими словами, более качественные и дешевые композиты для ветряных турбин, более эффективные и дешевые солнечные панели, улучшенный химический состав батарей и высокотемпературные сверхпроводники. Ускорение открытия и производства новых материалов может оказать чрезвычайно положительное влияние на развитие и рост нашего общества.

Возвращаясь к теме фармацевтики, теперь должно быть ясно, что машинное обучение предлагает нам путь к созданию передовых разработок и испытаний лекарств в центре обработки данных. Учитывая, что стоимость вывода на рынок нового лекарства достигла 2,5 миллиарда долларов и что устойчивая тенденция 20-го века к увеличению продолжительности жизни, похоже, иссякает (даже с учетом беспрецедентных затрат ), необходимость замены процессов, зависящих от удачи и перебора, должна быть очевидна.

Таким образом, «химия с автоматическим управлением» может позволить машинному обучению разрабатывать новые промышленные и терапевтические молекулы на заказ и трансформировать производственные процессы, которые их создают: это наш наиболее очевидный путь к пониманию наноразмерного мира. и производство наноструктурированных материалов в количествах и по ценам, которые действительно могут изменить нашу повседневную жизнь. Поскольку появление даже одного нового материала - меди, бронзы, железа, стали - может изменить наше общество, ценность процесса, который делает разработку и производство новых материалов рутинной, трудно переоценить.

Следуйте за мной, чтобы увидеть больше статей о новых приложениях машинного обучения и глубокого обучения. Чтобы узнать больше о применении машинного обучения в материаловедении, лучше всего начать с Matter Lab (Университет Торонто) или с этого видео ведущего исследователя Алана Аспуру-Гузика. Большое спасибо другому ведущему исследователю в этой области: я должен поблагодарить Исаака Тэмблина за разговоры, которые вдохновили меня на эту статью.