ИМ СО РАН 
Вход для сотрудников

Как использовать ИИ и сохранить ЕИ?

В Институте математики им. С. Л. Соболева СО РАН проходит X международная конференция «Знания-Онтологии-Теории» (ЗОНТ-2025), участники которой рассказали о математических методах представления и анализа данных, построении теорий предметных областей, анализе формальных понятий и извлечения информации из текстов. Многие выступающие посвятили свои доклады применению ИИ в различных сферах – от сугубо научных и коммерческих до практических высокотехнологичных – медицине, биоинформатике.

Мероприятие открыл академик РАН, д.ф.-м.н. Сергей Гончаров, который поделился с аудиторией проблемами доверенного ИИ. Он отметил, что ключ к надежному ИИ находится в фундаментальной математике. Отдельная важная задача – развитие методов кодирования вычислительных процессов. От абстрактной математической модели нужно перейти к реализуемой с гарантированной точностью. Сергей Гончаров сообщил, что одна из основных проблем доверенного ИИ это составление полной и непротиворечивой базы данных и алгоритма, которые приведут к допустимому решению. Таким прорывом стало решение давней проблемы Годунова о гарантированной точности из области численных методов, применяемых в задачах математической физики. Оказалось, что переход от рациональных к алгебраическим вещественным числам позволяет построить разрешимую модель, где можно гарантированно контролировать точность вычислений.

академик С. С. Гончаров

Сергей Гончаров напомнил собравшимся, что одна из первых задач еще не существовавшего ИИ была распознавание образов, когда нужно было автоматически определить адрес и индекс на почтовых конвертах и посылках. Позже появилась задача автоматизации переводов, которая тоже была решена. Но в ряде областей возникают проблемы доверенности действий ИИ, например, в медицине или на беспилотных транспортных средствах. Такие задачи требуют серьёзного анализа, выяснения всех необходимых условий для их решения. В обсуждениях доверенного ИИ досталось и знаменитому чату GPT, который зачастую подстраивается под запрос пользователя и даёт ожидаемый, но недостоверный ответ.

Академик РАН, д.б.н. Николай Колчанов выступил совместно с коллегой из НГУ Владимиром Иванисенко и посвятил своё выступление теме Big Data, биоинформатике и ИИ. Он отметил, что за последние 20 лет благодаря развитию технологий стоимость расшифровки генома упала на порядки. Это дало мощный толчок развитию других технологий – медицины, фармакологии, сельского хозяйства, биотехнологий, а также накоплению гигантского количества генетических данных. Генетика стала лидером по темпу накопления данных. Системная компьютерная биология – реконструкция и моделирование молекулярных и генетических систем и процессов на всех уровнях – от клетки до организма и популяции. После пандемии COVID-19 это направление стало особенно важным с точки зрения биобезопасности.

академик Н. А. Колчанов

Анализ больших генетических данных изменил наши представления о жизни, подчеркнул академик. Выявлен исключительно высокий уровень геномной изменчивости популяций человека, животных, растений. Различия между геномами могут достигать миллионов нуклеотидных последовательностей. Сегодня применяется метод полногеномного анализа, по которому написаны десятки тысяч работ, в том числе, две в Новосибирске в Институте цитологии и генетики СО РАН в интересах страховой медицины. Одна из них посвящена продолжительности периода здоровой жизни человека. Проанализировано 300 тысяч геномов. Выявлено 6 характеристик старения.

Николай Колчанов также рассказал про выведение новых пород сельскохозяйственных животных с улучшенными характеристиками. Ученые секвенируют геномы коров с повышенными надоями или с увеличенной мышечной массой. Создается статистическая модель свойства геномов этих животных на отборке нескольких тысяч животных. Затем выбирают локусы, отвечающие за конкретные признаки, и отбирают группы животных для скрещивания и выведения породы с заданными свойствами. Это стандартный подход – геномная селекция. Ученый отметил, что корова с рекордным надоем была создана в США – она давала более 30 тонн молока в год, правда, срок ее жизни оказался намного меньше, чем в среднем у этих животных.

Николай Колчанов продемонстрировал граф генной сети регуляции суточного ритма человека, в котором участвуют около 150-ти генов. Он рассказал, что в ИЦиГ СО РАН созданы компьютерные системы для реконструкции генных сетей. Затем туда был добавлен ИИ, и сегодня там содержится информация о более, чем 2-х млн генных белков, десятках тысяч метаболитов и десятках млн взаимодействий между генными объектами. Он показал словари объектов на основе нейронных сетей. Генетики обращаются к онтологии молекулярных функций и биологических процессов структур, в которых работают гены. Gene Ontology – это открытая мировая база, которая разрабатывается уже более 25-ти лет и содержит универсальное описание для всех видов организмов. В проекте GO был создан язык разметки для классификации данных (информации о генах и их продуктах, то есть РНК и белках, а также их функциях), который позволяет быстро находить систематизированную информацию о продуктах генов. Резюмируя свой доклад, академик Колчанов отметил, что недостаток нейронных сетей ведёт к низкому уровню прозрачности принимаемых решений, а когда мы строим модель процесса на основе миллионов данных, то можем изучать влияния конкретных факторов.

Больше всего вопросов из зала от заинтересованных слушателей вызвал необычный доклад член-корреспондента РАН, профессора НГУ Александра Марчука. Он посвятил своё выступление такому явлению советского времени, как ТРИЗ, которое, по его мнению, не получило должного развития. ТРИЗ – это Теория Решения Изобретательских Задач, методология советского учёного Генриха Альтшуллера, которая некоторое время факультативно преподавалась в технических вузах. По мнению выступающего, сейчас она могла бы активно использоваться в связи с новой модой вовлечения школьников в творческие исследовательские задачи и массовым увлечением искусственным интеллектом. Как решить нерешаемую задачу? Мозговым штурмом? Случайным блужданием мысли? ТРИЗ предлагает некоторую схему, начав с дотошного анализа каждого слова в условии задачи и их толкования.

чл.-корр. РАН А. Марчук

Максимально упростив методологию, можно вывести несколько базовых установок, в частности, уверенность в существовании решения, способность переформулировать поставленную задачу, разрешить противоречия и вывести алгоритм. Альтшуллер заметил, что для создания нового изобретения всегда нужно преодолеть какое-то противоречие. Он пришел к выводу, что противоречие всегда можно разрешить, создав некоторые недостающие условия или, наоборот, уничтожив препятствующие. Он разработал 40 основных приёмов преодоления противоречий для решения изобретательских задач и создал таблицу, в каких случаях нужно применять каждый из сценариев – изменить инструмент, исполнителя, разделить задачу по этапам и так далее.

– Удивительно, что попыток превратить эту методику в компьютерный продукт было сделано единицы, а те, что были, выглядят очень примитивно. Из известных нам западных систем, которые сейчас стали секретными, в частности, скандально известная система управления выборами Cambridge Analytica, – поделился Александр Марчук. – Я решил заняться самостоятельно этой проблемой вместе с увлечёнными и творческими ребятами в Школе юных программистов.

Конференция ЗОНТ-2025 полностью оправдала своё название, поскольку под её «куполом» состоялись десятки докладов на очень разные темы. Докладов, связанных с нейросетями и ИИ, было много. Часть из них была связана с достаточно абстрактными задачами, например, тестирование возможностей ИИ в той или иной области, вплоть до теста Тьюринга и сравнение искусственного интеллекта с естественным. – Зачем вы пытаетесь сделать ИИ похожим на человеческий? Ведь в его функции входит выполнение строго определенных задач, и круг их может расширяться, но давайте не будем превращать машину в человека, - предложили из зала.

Участники конференции

Однако некоторые работы имели вполне конкретную практическую ценность. Например, доклад о системе создания цифровых двойников управления для муниципальных служб, выступление о моделировании фаз реагирования на пожары, а также презентация, посвященная обработке результатов биопсии тканей с помощью искусственных нейронных сетей – автоматизация процесса медицинской диагностики. Сборник трудов Конференции будет проиндексирован в РИНЦ, избранные статьи будут опубликованы в IEEE Xplore и проиндексированы в Scopus.


Конференции