Нейронная сеть научилась искать лекарства от рака без помощи человека
Фото: © EAST NEWS
Пока её умения проверили на уже открытых лекарствах, но десятки точных "попаданий" указывают на то, что нейросети могут произвести переворот в фармакологии.
Команда исследователей из нескольких компаний и институтов, среди которых МФТИ, впервые применила нейронную сеть для создания новых лекарственных препаратов. Сначала её обучали на базе молекул с известной противораковой активностью. Затем она улавливала закономерности в структуре этих молекул, не очевидные человеку, и искала определённые особенности в строении других молекул, активность которых по отношению к раковым клеткам ещё не известна. Таким образом, нейросеть в автоматическом режиме искала кандидатов в новые лекарства. Этот подход способен в разы сокращать время и стоимость их поиска. Исследователи предполагают, что их детище сможет искать новые препараты против самых разных болезней, от опухолей до сердечно-сосудистых заболеваний. Соответствующая статья опубликована в Оncotarget.
Для проверки сети использовали патентную базу противораковых лекарств. Сначала обучали сеть на части лекарственных форм, а затем проверяли её на оставшихся лекарствах, которые ей ещё "не показывали". Задача была в том, чтобы предсказать такие действующие лекарственные формы, которых не было в обучающей выборке. В результате сети удалось предсказать 69 препаратов различных химических классов, среди которых ряд уже используется в борьбе с лейкемией и раком груди.
За основу архитектуры нейронной сети взяли состязательных автокодировщиков. Так называют расширения генеративных состязательных сетей. Сеть была составлена из трёх структурных элементов: кодировщика, декодера и дискриминатора. Каждый элемент выполнял свою специфическую роль, "сотрудничая" с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле. Дискриминатор помогал сделать сжатое представление молекулы более подходящим для последующего восстановления.
Нейросеть гораздо быстрее людей определила, какие 69 лекарств используют против рака груди и лейкоза
Фото: © EAST NEWS
Все молекулы имеют представление в виде "смайлзов" (SMILES) — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Правда, SMILES не очень подходит для представления молекул нейросети, так как каждая аннотация имеет произвольную длину от одной до двухсот букв. А для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт (в переводе "отпечаток пальца") молекулы. "Отпечаток" содержит в себе всю информацию о молекуле.
Существует множество способов построения отпечатка. Исследователи использовали самый простой— бинарный из 166 цифр. Они конвертировали SMILES в "отпечатки" и на них уже обучали сеть. На вход нейронной сети подавались "отпечатки" известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов (узлов нейросети, которые не следует путать с реальными нейронами живых существ) так, чтобы при заданном входе получился заданный же выход.
Фото: © МФТИ
Нейросеть функционировала как "чёрный ящик", который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала "отпечатки" новых молекул при обратном прогоне уже сама. Учёные автоматизированными методами построили цифровые "отпечатки" для всех молекул в базе и далее сравнивали сгенерированные сетью "отпечатки" с уже имеющимися. Отобранные таким образом вещества в теории должны обладать заданными обучающей группой качествами.
На данный момент только доля процента от всего числа потенциально полезных химических соединений используется в лекарственных препаратах. Вручную искать среди миллионов вариантов принципиально новую молекулу, обладающую лечебными свойствами, долго и дорого. Нейросеть поможет удешевить процесс. Следующим этапом в эксплуатации нейросети должен стать поиск новых лекарств и проверка их возможностей в ходе клинических испытаний.