Ученые из группы iMolecule Центра Сколтеха по научным и инженерным вычислительным технологиям для задач с большими массивами данных (CDISE) разработали алгоритм машинного обучения для поиска у белков сайтов связывания с лекарствами – потенциальных лекарственных мишеней. Алгоритм BiteNet за полторы минуты может проанализировать 1000 белковых структур и найти оптимальные места для присоединения лекарственных молекул. Результаты исследования опубликованы в журнале Communications Biology.
Мишенями лекарственных препаратов обычно служат белки – молекулы, контролирующие большинство биологических процессов. Для оказания терапевтического эффекта лекарства связываются с белками в определенных местах – сайтах связывания. Способность соединяться с лекарством определяется аминокислотной последовательностью участка и его пространственной структурой. Сайты связывания – настоящие «горячие точки» фармакологии. Чем больше известных сайтов связывания, тем больше возможностей для создания новых более эффективных и безопасных лекарств.
Аспирант Сколтеха Игорь Козловский и старший преподаватель Сколтеха (CDISE) Петр Попов разработали новый вычислительный подход для пространственно-временного обнаружения сайтов связывания у белков. Метод основан на применении к белковым структурам, которые позиционируются как 3D-изображения, алгоритмов глубокого обучения и компьютерного зрения. Новая технология позволяет детектировать даже сайты, которые сложно обнаружить: например ученым удалось обнаружить сайты связывания, которые скрыты в экспериментальных атомарных структурах или формируются несколькими белковыми молекулами, для рецептора, соединяющегося с G белком и эпителиального фактора роста, – одними из важнейших лекарственных мишеней, в случае онкологических заболеваний.
По словам руководителя исследования Петра Попова, геном человека насчитывает порядка 20 000 различных белков, однако лишь малая часть из них ассоциируется с фармакологической мишенью. «Наш подход позволяет исследовать белок на наличие сайтов связывания для лекарственно-подобных соединений, таким образом позволяя расширить набор фармакологических мишеней. Кроме того, успех начального этапа поиска лекарственных препаратов на основе структуры (structure-based drug discovery) сильно зависит от выбранной атомарной структуры белковой мишени. Работа со структурой, в которой сайт связывания закрыт для лекарства или отсутствует, может привести к неудаче. Наш метод позволяет анализировать большое количество структур одного белка и находить наиболее подходящую для данного этапа», – рассказывает Попов.
По словам первого автора исследования, аспиранта Сколтеха Игоря Козловского, BiteNet превосходит существующие аналоги по скорости и точности: «BiteNet основан на компьютерном зрении. Мы представляем белковые структуры в качестве изображений, а сайты связывания в роли объектов, которые мы ищем на этих изображениях. Одну пространственную структуру мы можем проанализировать за 0,1 сек, а за 1,5 минуты оценить 1000 изображений – тысячу белковых структур, по 2000 атомов в каждой».
*****
Сколтех – негосударственный международный университет. Созданный в 2011 году в сотрудничестве с Массачусетским технологическим институтом (MIT) Сколтех готовит новое поколение лидеров в области науки, технологий и бизнеса, проводит исследования в прорывных областях и содействует технологическим инновациям с целью решения важнейших проблем, стоящих перед Россией и миром. Сколтех развивает шесть приоритетных направлений: наука о данных и искусственный интеллект, науки о жизни и здоровье, современные методы проектирования и перспективные материалы, энергоэффективность, фотоника и квантовые технологии, перспективные исследования. Усилия Сколтеха призваны способствовать укреплению технологического превосходства России в приоритетных направлениях.