Нейронная сеть для поиска потенциальных лекарств
По сообщению Mail.Ru, разработчики из Mail.Ru Group, Insilico Medicine и МФТИ применили нейронную сеть к созданию новых лекарственных препаратов. Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, способно в разы сократить время и стоимость поиска веществ с потенциально лечебными свойствами. Предполагается, что эти технологии можно будет применять для поиска новых препаратов в самых разных областях – от онкологии до сердечно-сосудистых заболеваний.
База неорганических молекул на данный момент содержит примерно 72 млн веществ, и только доля процента из них используется в лекарственных препаратах. С помощью нейронной сети исследователи решали задачу выбора среди всех веществ новых молекул, обладающих лечебными свойствами.
За основу была взята архитектура состязательных автокодировщиков, являющаяся расширением генеративных состязательных сетей. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные. Сеть была составлена из трех структурных элементов – кодировщика, декодера и дискриминатора, – каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.
На вход нейронной сети подавались фингерпринты («отпечатки пальцев») известных лекарственных молекул. Исследователи построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой. Отобранные молекулы должны потенциально обладать заданными качествами.
Для проверки сети использовали патентную базу противораковых лекарств. Сначала обучали сеть на части лекарственных форм и проверяли на второй части. Задача была в том, чтобы предсказать уже известные формы, но такие, которых не было в обучающей выборке. На 69 из предсказанных веществ уже есть патенты.