От нейронных сетей до фондовых рынков: как развивают компьютерные науки в нижегородской ВШЭ
Созданная в 2011 году Международная лаборатория алгоритмов и технологий анализа сетевых структур (ЛАТАСС) НИУ ВШЭ в Нижнем Новгороде ведет широкий спектр фундаментальных и прикладных исследований, в том числе совместные проекты с крупными компаниями: Сбером, Яндексом и другими лидерами IT-отрасли. Разработанные учеными Вышки методы не только обогащают науку, но и позволяют улучшить работу транспорта компаний, более успешно вести медицинские и генетические исследования. О работе лаборатории «Вышка.Главное» побеседовала с ее заведующим — профессором Валерием Калягиным.
— Расскажите, как создавалась лаборатория.
— Она была организована в 2011 году по программе мегагрантов правительства России. Тогда работа иностранного ученого являлась обязательным условием участия в конкурсе. Нам повезло, что на наше предложение о сотрудничестве откликнулся профессор Университета Флориды Панагиотис Пардалос. Он и сейчас продолжает активно сотрудничать с ВШЭ и остается научным руководителем лаборатории. В подготовке заявки активно участвовали Олег Козырев, Эдуард Бабкин и Борис Гольденгорин. Борис Гольденгорин сыграл важную роль в становлении лаборатории.
Тогда изучение алгоритмов для анализа сетевых структур и то, что сейчас принято называть компьютерными науками, было новым направлением для Вышки в Нижнем Новгороде.

Через три года работу по гранту высоко оценило Минобрнауки РФ, его продлили на два года. Когда он заканчивался, мы подали заявку на создание международной лаборатории уже в Вышке, нас поддержали, и теперь мы продолжаем свою деятельность как лаборатория НИУ ВШЭ.
В первые годы работы мы привлекли много молодых исследователей, ставших затем известными учеными и специалистами-практиками.
— Что заинтересовало их в новой лаборатории?
— У них появилась уникальная возможность развития, работы с известными учеными в творческой атмосфере. Практически все воспользовались ей и за прошедшие годы выросли как ученые, исследователи и педагоги. Стратегия развития с самого начала была построена на обязательном сочетании научных исследований и преподавания. И сейчас все наши научные сотрудники преподают, этот компонент работы, передача опыта и компетенций, очень важен для ученого.
— Что удалось сделать за это время?
— За прошедшие годы лаборатория стала известным научным центром в России и в мире во многом благодаря усилиям профессора Пардалоса, обращающего много внимания на узнаваемость. У нас много контактов с коллегами из разных университетов и научных центров. Наша лаборатория — соорганизатор большой международной конференции по оптимизации и приложениям, мы участвуем в ее программном комитете, а наш научный руководитель — многократный почетный председатель программного комитета.
Мы активно взаимодействуем с нашими ведущими вузами — МФТИ, МГУ, с Институтом прикладной математики им. М.В. Келдыша РАН, с сибирскими и уральскими научными центрами в Новосибирске, Иркутске и Екатеринбурге.
— Каковы ключевые направления ваших работ?
— Это в основном компьютерные науки: сетевые модели, технологии анализа сетевых структур, различные аспекты оптимизации, в том числе задачи комбинаторной или дискретной оптимизации на графах, приложения к интеллектуальному анализу данных.
— Как это объяснить человеку, несведущему в высшей математике?
— Попробую пояснить доступно. Сеть — это набор узлов и связей между ними. Самые понятные примеры — социальные и телекоммуникационные сети, где узлы — люди или клиенты мобильного оператора, а связи — коммуникации между ними, измеренные определенным образом. Это может быть граф со специальными атрибутами или гиперграф.
Задача оптимизации тоже понятна: у вас есть, например, социальная сеть, и вы хотите понять, в какие узлы поместить информацию, чтобы она быстрее прошла по сети, или, напротив, какие узлы заблокировать, чтобы фейковое сообщение перестало циркулировать в сети.
Еще один класс задач, которые интересуют сотрудников, — большие базы данных, запросы информации в них. Это называется «задача поиска ближайшего соседа» в массиве данных, когда вы даете некоторый запрос в большой набор данных и хотите найти самый похожий на ваш запрос объект в этой базе.
Если база состоит из 10–20 объектов, сложностей нет, а когда их много, нужно правильно и быстро организовать поиск. Для этого поиска создается специальная графовая структура на этих данных, и она на порядок ускоряет поиск с помощью специальных алгоритмов.
— Возможно ли использовать ваши результаты в биологии или медицине?
— Мы исследуем класс сетевых моделей, к которому относятся некоторые биологические сети, например сеть нейронов головного мозга или сеть коэкспрессии (совместной экспрессии) генов.
Нейронов миллиарды, и мы не можем измерить что-либо в этих сетях. Но с помощью электроэнцефалограммы вероятно проследить активность отдельных участков мозга и проанализировать связь между ними. Создаются интересные сетевые структуры, которые можно использовать для изучения активности мозга, в том числе при заболеваниях, — например, анализ сетей нейронов при болезни Паркинсона и эпилепсии, что помогает в их исследованиях.

Сеть коэкспрессии генов (GCN) строится на основе профилей экспрессии генов для нескольких образцов или экспериментальных условий. Исследователи ищут пары генов, которые демонстрируют схожий паттерн экспрессии во всех образцах. В итоге создается сетевая модель, анализ которой используется в практических целях, в частности выделяются наиболее важные узлы этой модели. Выявленный кластер генов означает, что у гена и его соседей похожие профили экспрессии. Это в дальнейшем позволяет упростить тестирование лекарств.
— Насколько активно применимы ваши работы в экономике?
— Еще одна известная сеть — фондовые рынки. Мы анализируем активы, выявляем связи между ними. С их учетом образуется сеть фондового рынка. Анализ сетей фондовых рынков позволяет формировать инвестиционные портфели. Классический пример: модель оптимального портфеля инвестиций Марковица. Вместе с тем использование таких моделей не означает, что вы избежите риска, способного аннулировать весь потенциальный доход.
Крупные трейдерские компании, банки, фирмы, консультирующие инвесторов, хотят иметь понятную модель, как формировать инвестиционные портфели. Они не стремятся к сверхдоходам, а хотят надежно вкладывать средства. И тогда сетевые модели оказываются полезными. Дополнительная информация о связях помогает выделять портфели с нужными характеристиками.
— Наверное, вы и ваши коллеги — богатые люди.
— Мы не торгуем на рынках и не даем рекомендаций. Студенты пишут выпускные работы по этим и иным темам и анализируют, как и какие портфели работают на разных рынках.
Это не заменяет анализ, но полезно для него, открывает дополнительные возможности для деятельности на фондовом рынке.
Например, есть возможность выбора портфеля через построение рыночного графа сети и выделение в нем независимых множеств. Экспериментально доказано, что такие множества дают диверсифицированные и интересные с точки зрения доходности портфели.
— Предполагают ли разработанные вами модели разные сценарии развития?
— В лаборатории активно исследуется неопределенность алгоритмов построения различных графовых структур в сетевых моделях типа сетей коэкспрессии генов, сетей головного мозга, сетей фондовых рынков.
Если неопределенность велика, то выводы могут оказаться ложными: мы надеемся разбогатеть, но наши ожидания не сбываются.
— Как решение фундаментальных научных задач сочетается с прикладными работами?
— У нас работает сильная группа под руководством Дмитрия Малышева. По своему направлению (алгоритмическая теория графов) исследования этой группы ближе к теоретической информатике и дискретной математике. Значительное число аспирантов и молодых сотрудников лаборатории защитили диссертации по этим темам. Несмотря на фундаментальный теоретический характер исследований, они имеют и прикладное значение. Оценки вычислительной сложности задач на графах помогают выделить вычислительно трудные задачи и найти классы задач, которые возможно решить быстро.

В первые годы работы лаборатории у нас появилось направление интеллектуального анализа данных и ИИ. Им руководит Андрей Савченко. Он развивает направление интеллектуального анализа данных в условиях ограниченных ресурсов, например на мобильных устройствах, менее мощных, чем стационарные компьютеры или ноутбуки. Например, мы хотим классифицировать фотографии, тексты, что-то другое на нашем смартфоне, но у нас нет доступа к мощному ресурсу. На смартфоне вы не можете развернуть полноценную нейронную сеть. Он с коллегами разработал подход, позволяющий эффективно решать такие задачи, и запатентовал его как результат интеллектуальной деятельности (РИД). Уже есть приложения, которые можно скачать и пользоваться.
— Нужно ли это сейчас, когда нам обещают квантовые компьютеры с неограниченными возможностями?
— Руководитель исследовательского центра одной крупной зарубежной компании говорил недавно, что мы вернулись в ситуацию 1970-х годов, когда ученые и практики в условиях ограниченных возможностей процессоров и памяти компьютеров обращали особое внимание на эффективность алгоритмов. Потом скорость процессоров и емкость памяти, в том числе оперативной, резко выросли, и это несколько потеряло свою актуальность. Сейчас проблема вернулась, так как мы не ожидаем серьезного улучшения железа. Когда вы обучаете большие языковые модели или ведете поиск в больших базах данных, то возвращаетесь к необходимости быстрых вычислений в условиях ограниченных ресурсов. Сейчас многие крупные производители вычислительных ресурсов и IT-компании ведут исследования эффективного использования существующих возможностей. Если мы сократим вычисления хотя бы на одном узле на 1%, получим весомый эффект. У нас был успешный проект с одной IT-компанией по применению паттернов (шаблонов) графа вычислений для ускорения обучения нейронных сетей. Такие задачи приобретают все большую популярность.
Появление квантового компьютера с неограниченными возможностями — дело все же не самого ближайшего будущего.
— Какие компании пользовались вашими разработками?
— Мы разрабатывали алгоритм организации доставки продуктов к магазинам для крупной торговой сети. Это называется задача маршрутизации транспорта, она тоже сетевая и рассчитывает движение по сети дорог. Задача имеет высокую вычислительную сложность. Если у вас 100 автомашин и 1000 магазинов и вы хотите оптимизировать движение транспорта, то решить такую задачу вручную сложно. Компьютеру решить ее тоже нелегко, но помогают хитрые алгоритмы. Это дает возможность ИИ управлять логистикой использования транспорта.
— Есть ли проблема перехода ученых к индустриальным партнерам?
— Проблема оттока кадров в IT-компании есть. Мы начинаем взаимодействовать с компаниями, компании видят квалификацию наших кадров, предлагают им заниматься наукой и решением интересных задач и привлекают специалиста лучшими условиями.
— С какими подразделениями Вышки сотрудничает лаборатория?
— Наиболее тесное взаимодействие налажено с Международным центром анализа и выбора решений и с Лабораторией прикладного сетевого анализа.
— Какими вы видите перспективы исследований?
— Мы ориентируемся на сочетание фундаментальных и прикладных исследований, чтобы мы имели как хорошие теоретические результаты и публикации, так и совместные проекты с индустрией.
Стратегия кампуса — расширение прикладных исследований, это и общероссийский тренд. Надо научиться содержательно отвечать на вопрос, как с помощью наших теоретических разработок можно получить реальный вклад в развитие экономики и социальной сферы страны. Мы видим свои перспективы в развитии алгоритмов и технологий для систем искусственного интеллекта.
Кроме чисто научной составляющей, важна популяризация науки, чтобы сделать теоретические и прикладные результаты доступными для школьников, наших будущих студентов и сотрудников лаборатории.
Лаборатория как один из ведущих научных центов в области компьютерных наук и приложений открыта к новым партнерским проектам как фундаментального, так и прикладного характера.
— В каких образовательных программах вы участвуете?
— Мы вовлечены в две ключевые программы в кампусе: «Прикладная математика и информатика» (подготовка бакалавров) и «Интеллектуальный анализ данных» (подготовка магистров). Тематика лаборатории активно присутствует в этих программах. Это находит отражение как в преподавании, так и в научной работе студентов.
Все международные лаборатории развивают исследовательскую экспертизу и передают ее молодежи. Если не иметь контакта со студентами, то где мы наберем новых молодых сотрудников?
Добавлю, что наши выпускники востребованы во многих компаниях и странах.
— Почему важно сохранять фундаментальные исследования?
— Мы видим сейчас второе рождение математики, развитие интеллектуального анализа данных и технологий искусственного интеллекта породило задачи, требующие специалистов с развитым абстрактным мышлением и широким кругозором, который дает фундаментальная математика. При этом востребованы многие разделы математики. Это признак XXI века.
Например, мы имеем огромный набор данных и стараемся понять, как он устроен. Часто высокая размерность данных является препятствием для их анализа. Чтобы понизить размерность без потери информации, надо хорошо понимать многие разделы фундаментальной математики — от классических методов линейной алгебры и математического анализа до продвинутых вероятностных моделей и топологии.
Математики встрепенулись, люди видят, что им надо расширять поле своей деятельности на прикладные исследования, это характерная черта Вышки.
— Как удается поддерживать международные связи?
— Мы продолжаем контакты с зарубежными учеными. Начиная с 2012 года мы регулярно проводим ежегодную международную конференцию по сетевому анализу, международные школы для молодых ученых. Практически все, кто приезжал в Нижний Новгород, продолжают общение, откликаются на предложения, несмотря на прошедшую пандемию и текущую ситуацию. Для молодых ученых это дополнительная возможность оценить уровень своих исследований, он становится понятнее при контакте с коллегами из-за рубежа. Мы стремимся, чтобы молодежь активно общалась с гостями. Студентам это тоже интересно.
Вам также может быть интересно:
Ученые выявили когнитивные механизмы биполярного расстройства
Международная команда исследователей с участием ученых из НИУ ВШЭ экспериментально показала, что люди, страдающие биполярным расстройством, считают мир более нестабильным, чем он есть на самом деле, и из-за этого чаще принимают нерациональные решения. Ученые предполагают, что полученные результаты позволят в будущем разработать более точные методы диагностики и терапии биполярного аффективного расстройства. Статья опубликована в журнале Translational Psychiatry.
Гражданская идентичность помогает россиянам поддерживать психологическое здоровье в условиях санкций
Исследователи НИУ ВШЭ выяснили, что осознание себя частью страны может психологически помогать в трудные периоды, особенно, если человек склонен переосмысливать происходящее или обращаться к духовным и культурным ценностям. Переосмысление, в том числе, способно несколько снизить уровень депрессии. Исследование опубликовано в Journal of Community Psychology.
Когда мысли становятся движением: как нейроинтерфейсы меняют медицину и жизнь
В начале XXI века человек все чаще становится не просто наблюдателем, а активным участником технологической революции. Среди достижений, способных изменить судьбы миллионов людей, особое место занимают нейроинтерфейсы — системы, связывающие мозг с внешними устройствами. Именно они стали центральной темой весенней Международной школы «Нейроинтерфейсы нового поколения», прошедшей в стенах НИУ ВШЭ.
«У науки нет национальных границ»
Иностранные ученые успешно продолжают работу в лабораториях Вышки, сочетая фундаментальные и прикладные исследования, позволяющие достичь значимых результатов. О деятельности Лаборатории алгоритмов и технологий анализа сетевых структур в НИУ ВШЭ — Нижний Новгород новостная служба «Вышка.Главное» побеседовала с ее научным руководителем — профессором Паносом Пардалосом.
Ученые ВШЭ рассказали, как определить важные для речевой функции области мозга при операциях
Сотрудники Центра языка и мозга НИУ ВШЭ провели школу по трактографии — методу, который позволяет «увидеть» важнейшие связи в мозге и помогает хирургам избежать повреждений критически важных для речевой функции областей во время операции. Участниками курса стали нейрохирурги и радиологи из Москвы и других регионов страны, интересующиеся методами предоперационного картирования речи.
«Огромное счастье — возможность обсудить свои научные идеи с заинтересованными людьми»
Созданная в нижегородском кампусе Вышки Международная лаборатория динамических систем и приложений ведет глубокие теоретические изыскания и прикладные исследования, среди которых изучение океанических волн, пересоединений солнечной короны, вулканических явлений и устойчивости судов. Ее ученые, за последние 5 лет выигравшие более 20 значимых научных грантов, активно сотрудничают с российскими и зарубежными коллегами из Китая, Испании, США, Великобритании, Бразилии и других стран. О работе лаборатории новостная служба «Вышка.Главное» побеседовала с ее заведующей, профессором Ольгой Починкой.
Лингвисты НИУ ВШЭ выяснили, как билингвы используют конструкции с числительными в русском языке
Исследователи ВШЭ выделили более 4000 примеров устной русской речи билингвов из семи регионов России и выяснили: большинство нестандартных форм в конструкциях с числительными связано не только с их родным языком, но и с тем, как часто выражение встречается в повседневной речи. Например, фразы «два часа» или «пять километров» почти всегда совпадают с литературным вариантом, а вот менее привычные выражения, особенно с числительными от двух до четырех, а также с собирательными формами вроде «двое» или «трое», часто звучат иначе. Исследование опубликовано в журнале International Journal of Bilingualism.
Первый цифровой тест для оценки навыков чтения у взрослых доступен на RuStore
Центр языка и мозга НИУ ВШЭ разработал первый стандартизированный инструмент для оценки навыков чтения на русском языке у взрослых — тест «ЛексиМетр-В». Теперь он доступен в цифровом формате на платформе RuStore. Это приложение позволяет быстро и эффективно диагностировать нарушения чтения, включая дислексию, у людей в возрасте от 18 лет и старше.
Двадцать против десяти: в НИУ ВШЭ проанализировали, как развивались числительные у лезгинских народов
Считается, что в лезгинских языках Дагестана и Азербайджана изначально использовалась двадцатеричная система счета, а десятичная появилась позже. Однако новый анализ числительных в разных диалектах показал, проведенный лингвистом из НИУ ВШЭ Максимом Меленченко, что могло быть и наоборот: изначально использовался десятичный счет, а двадцатеричный появился позже. Исследование опубликовано в журнале Folia Linguistica.
Сервисы должны быть гибкими: как использовать искусственный интеллект государству
Международная лаборатория цифровой трансформации в государственном управлении НИУ ВШЭ провела круглый стол «Искусственный интеллект в государственном управлении: современные тенденции». Какие сервисы улучшит ИИ и что важно учитывать, применяя новые технологии, рассказали российские и зарубежные ученые.