Создание новых молекул всегда было сложнейшей задачей в химии. Чтобы получить перспективное лекарство или современный материал, учёным приходится продумывать последовательность реакций. Этот процесс отнимает годы практики и требует глубоких знаний. Главная трудность заключается в том, чтобы правильно выбрать исходные вещества и предугадать, как пройдёт реакция.
В чём главная трудность для химиков
Один из ключевых методов называется ретросинтез. Учёный начинает с конечной молекулы, которую хочет получить, и движется назад, подбирая простые исходные компоненты. На этом пути нужно решить множество вопросов: когда формировать кольца, стоит ли защищать чувствительные участки молекулы и какие строительные блоки использовать. Компьютеры способны перебирать огромные объёмы данных, но с опытом живого химика им равняться пока сложно. Кроме того, важно понимать, как именно движутся электроны в ходе реакции — это позволяет предсказывать новые превращения и избегать лишних экспериментов. Существующие программы часто предлагают много вариантов, но им не хватает интуиции, чтобы выбрать самый реалистичный.

Новый взгляд с помощью привычных технологий
Исследователи из Федеральной политехнической школы Лозанны под руководством Филиппа Шваллера разработали необычный метод. Они применили большие языковые модели — те же технологии, что лежат в основе современных чат-ботов, — для помощи химикам. Система получила название Synthegy. Вместо того чтобы самой рисовать химические структуры, она выступает в роли эксперта, который оценивает варианты, предложенные другими программами.
«Когда мы делаем инструменты для химиков, интерфейс очень важен. Прежние решения опирались на сложные фильтры и правила. Synthegy позволяет химикам просто говорить, что им нужно, ускоряя поиск и помогая справляться с более сложными идеями», — объясняет Андрес М. Бран, первый автор исследования, опубликованного в журнале Matter.
Как Synthegy помогает планировать синтез
Работа начинается с того, что химик описывает конечную молекулу и даёт инструкцию обычными словами. Он может попросить, чтобы определённое кольцо формировалось раньше или чтобы избегали лишних защитных групп. Стандартная программа для ретросинтеза генерирует множество возможных путей. Дальше в дело вступает Synthegy:
- Каждый предложенный путь переводится в текст;
- Языковая модель проверяет, насколько он соответствует запросу;
- Система выставляет оценку и объясняет своё решение;
- Химик получает на руки лучшие, отфильтрованные варианты.
Такой подход позволяет быстро сосредоточиться на тех стратегиях, которые действительно соответствуют замыслу учёного.
Разбор механизмов реакций
Аналогичным образом система работает и с изучением механизмов. Реакция разбивается на простые перемещения электронов, и программа исследует разные варианты. Каждый шаг оценивается языковой моделью, которая направляет поиск в сторону химически осмысленных путей. В дополнение Synthegy учитывает условия реакции и гипотезы самого исследователя, которые подаются в виде текста. Это даёт химикам возможность уточнять анализ и рассматривать более реалистичные сценарии.
- Система разбивает реакцию на элементарные стадии;
- Модель анализирует каждый вариант;
- Поиск идёт в сторону разумных с химической точки зрения решений;
- Учёный может добавлять уточнения по ходу работы.
Проверка на практике
В двойном слепом эксперименте участвовали 36 химиков. Они дали 368 оценок работе системы. В 71,2% случаев мнение учёных совпало с оценками Synthegy. Инструмент умеет отмечать ненужные защитные шаги, оценивать реалистичность реакций и предлагать эффективные решения. Исследование также показало, что более крупные языковые модели справляются лучше, а маленькие демонстрируют ограниченные возможности. Работа опубликована на портале ScienceDaily.
Исследование предлагает новый взгляд на роль искусственного интеллекта в химии. Synthegy не заменяет учёного, а помогает быстрее обрабатывать и осмысливать результаты компьютерных расчётов. Химик описывает задачу простыми словами и получает решения, которые учитывают его стратегию. В будущем такой подход способен ускорить поиск лекарств, улучшить дизайн реакций и сделать сложные инструменты доступнее для специалистов.


