сен

2025

«Биотех бурлит во всем мире, его кривая роста опережает развитие компьютерных технологий»

Более пяти лет в НИУ ВШЭ действует Международная лаборатория биоинформатики факультета компьютерных наук. За это время ее ученые добились значительных научных результатов. Здесь разработан уникальный в мировой практике тест «Кардиожизнь», позволяющий прогнозировать вероятность проявления сердечно-сосудистых заболеваний. С привлечением студентов и аспирантов Вышки ведутся исследования для создания лекарств нового поколения. Заведующая лабораторией Мария Попцова рассказала о ее работе в интервью новостной службе «Вышка.Главное».

— Когда была создана лаборатория?

— Сначала была организована научно-учебная группа в 2018 году. Примерно через полгода она была преобразована в научно-учебную лабораторию. А уже в период пандемии мы стали международной лабораторией. Тогда можно было пригласить в лабораторию иностранного ученого без его обязательного присутствия в России.

В то время мы активно разрабатывали модели глубокого обучения для анализа геномных данных, и нам было важно взаимодействовать с зарубежными коллегами, обмениваться идеями и данными. Наличие статуса международной лаборатории позволило наладить сотрудничество с экспериментальной лабораторией Онкологического центра Фокс-Чейза Университета Пенсильвании, и наш совместный проект завершился публикацией статьи в ведущем мировом журнале Nature. Коллеги направляли нам экспериментальные данные, мы их обрабатывали и как биоинформатики, и как дата-сайентисты: строили модели глубокого обучения для прогнозирования крайне важного элемента в геноме — Z-ДНК, вторичной структуры ДНК, закрученной не вправо, а влево. Построенная нами модель была использована при исследовании механизма действия лекарства от рака.

— Почему вы решили выбрать научным руководителем профессора Алана Герберта? Какова его роль в работе лаборатории?

— С профессором Аланом Гербертом мы познакомились, когда подали статью в один из международных журналов, где мы предлагали нашу первую модель глубокого обучения для прогнозирования Z-ДНК. В рецензии было указано, что мы не учли несколько работ по нашей тематике. Когда стали разбирать замечания, выяснилось, что автором всех упомянутых статей был Алан Герберт, известный ученый в области вторичных структур ДНК, ключевой специалист по тематике наших исследований. Мы списались по электронной почте, затем поговорили по Zoom. Как раз летом 2020-го мы проводили летнюю школу по машинному обучению в биоинформатике, которую из-за пандемии коронавируса пришлось перенести в онлайн, и благодаря этому нам удалось собрать ученых из разных стран: США, Китая, европейских государств. Профессор Герберт увидел уровень наших докладов и согласился стать научным консультантом.

С тех пор мы активно работаем с ним онлайн. Вместе мы организовали ставшую ежегодной международную конференцию ABZ по Z-ДНК, которая все эти годы проводилась онлайн, но есть планы провести ее в будущем году очно в Оксфорде.

Алан Герберт продолжает выстраивать научное сотрудничество с учеными из других стран, хотя сейчас это нелегко. Помимо работы в университетах, он возглавляет небольшой стартап, и это тоже помогает в выстраивании международных связей.

— Как объяснить непосвященным, что такое биоинформатика, какие научные дисциплины она соединяет?

— Изначально биоинформатика возникла как компьютерные методы обработки данных молекулярной биологии. Обычно это информация об объектах, которые находятся внутри клетки: ДНК, РНК, белки и другие макромолекулы. Практически одновременно с появлением компьютеров начались эксперименты по расшифровке состава этих макромолекул. Например, последовательность ДНК можно написать текстом на алфавите из четырех букв, а белка — на алфавите из 20 букв, и есть правило перевода одного алфавита в другой — так называемый генетический код. В конце 1960-х годов его расшифровали. Одновременно технологически научились получать последовательности ДНК и белков из разных организмов. Тогда же возникла необходимость разрабатывать алгоритмы для оценки схожести и различия последовательностей, чтобы рассчитать вероятность процессов, объясняющих, как одна строка ДНК трансформировалась в другую. Так и появилась биоинформатика. А дальше ее методы и алгоритмы развивались и усложнялись параллельно с появлением новых биотехнологий.

— В чем это выражается?

— Появилась, например, технология полногеномного секвенирования. Как следствие, возникла необходимость обрабатывать полногеномные данные и извлекать из них информацию. Например, сравнивать последовательности разных геномов или определять изменения в геноме конкретного человека — замену одной буквы, вставку или удаление маленьких и больших подстрок.

Далее появилась новая линейка экспериментальных технологий, благодаря которым можно прочитать не только последовательность ДНК, но и сигналы с других уровней кодирования информации — так называемый эпигенетический код.

Мы открывали лабораторию под изучение вторичных структур ДНК, тоже закодированных в геноме, с дальнейшей целью понять, по каким алгоритмам и правилам работает геном. Для решения данной задачи необходимо сопоставлять все уровни кодирования генетической информации. Поскольку в геноме человека насчитывается 3 млрд символов и уже сейчас доступны сотни тысяч полногеномных экспериментов по определению сигналов эпигенетического кода, возникла необходимость применения алгоритмов глубокого обучения для понимания связей между разными кодировками. В сферах, не связанных с биологией, алгоритмы глубокого обучения эволюционируют очень быстро, поэтому необходимо так же быстро адаптировать их применение к нашим биологическим задачам.

— Каковы ключевые направления исследований вашей лаборатории?

— Мы разрабатываем методы и архитектуры алгоритмов глубокого обучения для своих задач. В последние пару лет уже в геномике специально для биологии стали появляться большие языковые модели и фундаментальные модели, построенные на алгоритмах, на которых работают ChatGPT, DeepSeek и другие сложные системы ИИ.

Большие языковые модели в геномике, так же как и в языках, очень большие (Evo2, к примеру, содержит 40 млрд параметров), и, чтобы их запустить, нужен суперкомпьютер

Одна из наших задач состоит в тестировании таких гигантских моделей на геномах кардиопациентов и их внедрении в генетические тесты. Мы также занимаемся разработкой собственных моделей глубокого обучения для анализа кода вторичных структур ДНК и эпигенетики.

Среди других направлений в лаборатории развиваются исследования микроокружения опухоли на данных одноклеточного секвенирования, что позволяет понять, какие гены или программы включены, а какие выключены в отдельной клетке.

Например, если мы берем образец опухоли, то в нем есть клетки нормальной ткани, опухолевой ткани и клетки иммунной системы: лимфоциты, макрофаги, нейтрофилы и другие. Основной вопрос, на который мы хотим получит ответ, — почему и как опухоль избегает иммунного ответа. В нормальном организме клетки иммунной системы должны распознавать чужеродные опухолевые клетки и ликвидировать их, но опухолевые клетки как-то перепрограммируют клетки иммунной системы так, что они перестают распознавать и уничтожать раковые клетки. Такое поведение обусловлено действием генетических программ, подавляющих или, наоборот, активирующих иммунный ответ. Мы пытаемся такие программы выявить и изучить. Данное направление развивается пока на открытых данных, но мы планируем налаживать сотрудничество с российскими экспериментальными лабораториями.

Параллельно мы ведем исследования роли некодирующих вариантов, находящихся не в генах, кодирующих белки, а в межгенном пространстве, которое занимает 98% размера генома. Эффект таких некодирующих вариантов малоизучен. Мы разрабатываем методы глубокого обучения и используем большие языковые модели, чтобы определить эффект некодирующих вариантов, способных влиять на производство белка или, наоборот, прекращать его выработку клеткой, что может быть связано с возникновением и течением болезни.

— В каких областях медицины и биологии наиболее востребованы результаты работы лаборатории? Где они позволяют добиться серьезного прогресса в профилактике и лечении болезней?

— Одно из таких направлений — тестирование в области кардиогенетики, отстающей по сравнению с онкогенетикой. Мы развиваем данное направление около пяти лет. Нами был организован кардиогенетический консорциум, куда вошли врачи, биоинформатики и генетические лаборатории, способные секвенировать, то есть прочитывать, индивидуальный геном. В рамках проекта «100 000 российских геномов» мы работаем с кардиоцентром имени Чазова и 29-й горбольницей имени Баумана. Сейчас у нас отсеквенировано около 1000 полных геномов, которые мы исследуем на наличие вариантов, ассоциированных с кардиозаболеваниями.

На сегодняшний день известно более 900 генов, участвующих в развитии сердечно-сосудистых заболеваний. Весь наш накопленный опыт позволил нам создать генетический тест, названный «Кардиожизнь», который уже доступен на коммерческой основе. С его помощью пациент может получить информацию о наличии патогенных вариантов, ассоциированных с сердечно-сосудистыми заболеваниями.

— Каковы перспективные направления ваших исследований?

— Наша лаборатория готова расширить масштаб работ, перейдя в онкогенетику, поскольку методы генетического тестирования одинаковы для разных заболеваний. Кроме того, у нас есть опыт анализа большого массива геномных данных с помощью алгоритмов ИИ. Стоит задача найти небольшое количество маркеров, имеющих хорошую прогностическую силу. Чем меньше маркеров, способных прогнозировать заболевание, тем проще осуществлять масштабирование тестирования. Ожидается, что проводить раннюю диагностику рака возможно 8–10 маркерами. Это наша задача на ближайшее будущее.

— В чем ключевые особенности разработанного лабораторией теста «Кардиожизнь»?

— Это уникальный, не имеющий аналогов в мире тест, созданием которого мы гордимся. Из числа имеющихся сегодня тестов он наиболее полно учитывает набор генов и регуляторные области. Есть стандартные программы, которые применяются для генетического тестирования в генетических компаниях. Мы же проводим исследование на порядок глубже. У одного гена может быть много разных вариантов, и мы перебираем все изоформы, поскольку даже одна и та же мутация может по-разному влиять на изоформы. В дополнение мы анализируем некодирующие варианты и определяем их влияние на экспрессию генов с применением методов ИИ. В этом уникальность теста «Кардиожизнь». При стандартном генетическом тестировании такие исследования не проводятся.

— Расскажите о ключевых направлениях работы зеркальной лаборатории с Сургутским университетом.

— Анализ и создание прогностических систем на основе методов ИИ в медицине. Данный проект вырос из кардиогенетического консорциума, когда мы узнали, что в Ханты-Мансийском автономном округе — Югре электронные медицинские карты хранятся с 2009 года. Мы стали анализировать медицинские карты пациентов, попавших в сургутский окружной кардиоцентр с диагнозом «инфаркт миокарда».

Пациентам оказывали помощь, выписывали из больницы и отслеживали дальнейшее течение событий, поскольку у многих из них был высокий риск неблагоприятных событий: повторного инфаркта, инсульта, кровотечения и смерти. Мы построили прогностическую систему оценки риска наступления такого события, обучаясь на данных 10 000 пациентов за период с 2009 года. Есть идея дообучать эту модель на данных других кардиологических центров. Мы также научились обрабатывать медицинские данные для подачи алгоритмам машинного обучения — как классическим, так и тем, на основе которых сделан ChatGPT. Этот проект хорошо масштабируется и переносится в другие регионы. Также врачи могут поставить новые задачи. Например, можно создать модель для прогноза возникновения побочных эффектов от назначения тех или иных лекарств.

В частности, в сотрудничестве с Российской медицинской академией непрерывного профессионального образования мы начали строить первые модели по предсказанию неблагоприятных событий при приеме антикоагулянтов и антидепрессантов. Это очень важно, поскольку у них много побочных эффектов, особенно у подростков.

— Используется ли ИИ в разработке лекарств?

— Еще одно направление, которым мы недавно начали заниматься, — применение методов ИИ для генерации лекарств белковой природы. Напомню, что в 2024 году Нобелевской премии по химии «за вычислительный дизайн белков и предсказание их структуры» удостоились директор Института белкового дизайна Университета Вашингтона в Сиэтле Дэвид Бейкер и сотрудники Google DeepMind Демис Хассабис и Джон Джампер. В последние годы произошел прорыв в разработке лекарств благодаря применению генеративных моделей для создания пептидов из 15–20 аминокислот, которые могут связываться с заданным участком белка. Белковые байндеры представляют собой новое поколение лекарств, которое, в отличие от нынешних, базирующихся на химических молекулах, будет иметь биологическую природу. Вместо громоздких химических антител можно будет применить байндеры для связывания с вредоносными белками. Разработанные Бейкером и его институтом модели находятся в открытом доступе. И теперь уже студенты защищают дипломы и курсовые по использованию этих моделей для открытия белок-белковых взаимодействий. Создано немало компаний, занимающихся разработкой такого рода лекарств белковой органической природы. За этим будущее. Мы тоже работаем в этой сфере, есть уже первые результаты.

Биотех бурлит во всем мире, его кривая роста опережает развитие компьютерных технологий.

Известный футуролог, топ-менеджер Google Рэй Курцвейл, прогнозирующий научно-технический прогресс и его ключевые прорывы, предсказавший появление беспилотных автомобилей и ИИ, полагает, что к середине 2030-х годов ожидается сингулярность, когда человек сольется с ИИ и возникнет новый гибридный способ сосуществования. Будут изучены важнейшие области человеческого мозга и расшифрованы алгоритмы работы клетки. Совмещение этих знаний позволит программировать клетки ткани и выращивать органы. Такая фантастика ждет нас благодаря сочетанию биотехнологий и искусственного интеллекта.

— Какие результаты фундаментальных и прикладных работ вы бы назвали ключевыми достижениями лаборатории?

— Создание «Кардиожизни», публикацию в Naturе, открытие потенциального лекарства от рака посредством включения генетической программы через вторичную структуру ДНК, создание моделей глубокого обучения для полногеномной аннотации вторичной структуры ДНК — это, кроме нас, не делал никто в мире.

— Как используются результаты научных работ лаборатории в учебном процессе университета?

— Я всегда даю студентам темы курсовых и дипломов по актуальным научным задачам. Если они их успешно решают, то становятся авторами научной публикации. На лекциях я всегда освещаю работу лаборатории, а на междисциплинарном майноре «Биоинформатика» рассказываю, как студенты могут погрузиться в науку через курсовые и дипломы. С сентября буду вести спецкурс, где мы со студентами будем подробно разбирать научные методы и прорывные идеи последних двух-трех лет.

— Насколько активно в деятельности лаборатории участвуют студенты и аспиранты Вышки?

— Весьма активно. У нас работают более 20 стажеров-исследователей: студенты старших курсов бакалавриата, магистранты и аспиранты.

Дата

12 сентября 2025

Рубрики

Программа развития 2030

Темы

биоинформатика Вышка технологическая зеркальные лаборатории Приоритет 2030 центры превосходства

В статье упомянуты

Факультет компьютерных наук, Центр биомедицинских исследований и технологий

Персоны

Попцова Мария Сергеевна

Вам также может быть интересно:

фев

2026

Ученые ВШЭ выявили механизм нарушения липидного обмена в плаценте при преэклампсии

Ученые НИУ ВШЭ обнаружили, что при преэклампсии — одном из самых опасных осложнений беременности — плацента перестраивает липидный обмен, снижая собственный синтез холестерина и усиливая его передачу плоду. Этот компенсаторный механизм помогает сохранить питание ребенка, но ускоряет изнашивание плаценты и может приводить к преждевременным родам. Результаты работы опубликованы в международном журнале Frontiers in Molecular Biosciences.

9 февраля

фев

2026

«Наша задача — в создании лазеров как носителей информации»

Международная лаборатория квантовой оптоэлектроники НИУ ВШЭ в Санкт-Петербурге занимается разработкой полупроводниковых микролазеров. Создаваемые лабораторией компоненты и системы также обеспечивают высокую скорость передачи и обработки данных. «Вышка.Главное» обсудила перспективы и направления исследований лаборатории с ее руководителем — доктором физико-математических наук Натальей Крыжановской.

5 февраля

фев

2026

В ВШЭ создан департамент кибербезопасности

В Московском институте электроники и математики им. А.Н. Тихонова ВШЭ открылось новое подразделение. Среди его задач — объединение образовательных, научных и экспертных ресурсов МИЭМ в области информационной и компьютерной безопасности, расширение портфеля образовательных программ, укрепление партнерства с лидерами индустрии и позиций ВШЭ как ведущего центра компетенций в области кибербезопасности.

3 февраля

фев

2026

Серьезный вызов: студенты Вышки исследуют глобальные технологические тренды и стартапы

В НИУ ВШЭ подвели промежуточные итоги совместного исследовательского проекта с компанией ЭФКО: студенты представили результаты исследований и рассказали о дальнейших планах. Проект ориентирован на вовлечение студентов в прикладные исследования по трем крупным направлениям: анализ глобальных технологических стартапов, изучение культурного кода и созидательного потенциала общества, а также прогнозирование социально-экономического развития России.

2 февраля

янв

2026

В НИУ ВШЭ пройдет II конгресс «Генетика и сердце»

Высшая школа экономики, Национальная исследовательская лига кардиологической генетики (НИЛКГ) и Центральная государственная медицинская академия (ЦГМА) Управления делами Президента РФ организуют II Конгресс с международным участием «Генетика и сердце». Мероприятие состоится 7–8 февраля 2026 года в Центре культур НИУ ВШЭ.

30 января

янв

2026

Ученые ВШЭ выяснили, как сила авторитета формирует доверие

Исследователи Института когнитивных нейронаук НИУ ВШЭ выяснили, как мозг реагирует на аудиодипфейки — реалистичные поддельные записи речи, созданные с помощью ИИ. Выяснилось, что люди склонны доверять мнению авторитетного спикера даже в тех случаях, когда новые утверждения противоречат его прежней позиции. Это работает и в ситуациях, когда утверждение не согласуется с собственным мнением слушающего. Исследование опубликовано в журнале NeuroImage.

29 января

янв

2026

МИЭМ ВШЭ и Инновационный центр «Альфачип» заключили соглашение о сотрудничестве

Среди основных задач — совместные проекты в области микроэлектроники, участие специалистов компании в сопровождении научно-исследовательской деятельности студентов и аспирантов. Также планируется подготовка совместных научных публикаций, организация производственной практики и стажировок студентов, повышение квалификации специалистов компании.

28 января

янв

2026

«Я — профессионал»: ВШЭ — в лидерах по числу студентов в заключительном этапе

С сентября самые талантливые студенты со всей страны боролись за право стать частью вселенной карьерных возможностей «Я — профессионал» и получить доступ к бонусам при поступлении в магистратуру Высшей школы экономики, стажировкам в известных компаниях-партнерах («Яндекс», Сбербанк, ВТБ, РЖД и др.) и денежному вознаграждению до 300 000 рублей. Вышка вошла в число лидеров по количеству студентов, прошедших в заключительный этап олимпиады «Я — профессионал», который состоится с февраля по апрель 2026 года.

28 января

янв

2026

Математик из НИУ ВШЭ в Нижнем Новгороде нашел способ решить уравнение, нерешаемое с XIX века

Ученый из НИУ ВШЭ в Нижнем Новгороде и ИППИ РАН Иван Ремизов совершил концептуальный прорыв в теории дифференциальных уравнений. Ему удалось вывести универсальную формулу для решения задач, которые более 190 лет считались нерешаемыми аналитическим путем. Полученный результат радикально меняет картину мира в одной из старейших областей математики, важной для фундаментальной физики и экономики. Результаты работы опубликованы во Владикавказском математическом журнале.

27 января

янв

2026

НИУ ВШЭ и ГК InfoWatch подписали соглашение о сотрудничестве

Соглашение ознаменует новый этап сотрудничества между НИУ ВШЭ и ГК InfoWatch, который направлен на развитие образовательных программ и укрепление практико-ориентированного подхода в подготовке кадров для цифровой экономики. Стороны договорились совместно разрабатывать и проводить экспертизу учебных программ. Кроме того, эксперты ГК InfoWatch будут вести преподавательскую работу в рамках обучения студентов IT- и ИБ-направлений Высшей школы экономики.

27 января