Семинар лаборатории анализа данных

Архив семинара

18 марта 2025 г.

Николаев Ростислав Олегович (НГУ)
Применение больших языковых моделей для анализа временных рядов.

Аннотация

В рамках доклада будет рассмотрено применение больших языковых моделей (LLM) для анализа временных рядов, сочетающее классические методы обработки последовательностей с современными подходами искусственного интеллекта. В выступлении представлен обзор традиционных алгоритмов анализа временных рядов, таких как ARIMA и преобразования Фурье, а также ключевых задач в этой области: прогнозирование, классификация и обнаружение аномалий. Далее обсуждаются возможности LLM, включая их адаптацию к специфическим задачам через zero-shot и few-shot обучение, что позволяет минимизировать потребность в размеченных данных. Особое внимание уделено анализу статьи [Jin M., Tang H., Zhang C., Yu Q., Liu C., Zhu S., et al. Time Series Forecasting with LLMs: Understanding and Enhancing Model Capabilities. arXiv preprint arXiv:240210835. 2024], демонстрирующей эффективность LLM в прогнозировании временных рядов за счет их способности улавливать долгосрочные зависимости и контекстуальные паттерны.

04 марта 2025 г.

Михайлапов Д. И.
Полу-контролируемая 3D сегментация расслоения аорты типа "B" с помощью SLIM-UNETR.

Аннотация

В настоящее время широко используются сверточные нейронные сети (CNN) для многоклассовой сегментации медицинских изображений. Особенно это касается моделей с несколькими выходными данными, которые могут отдельно предсказывать классы сегментации (регионы), не полагаясь на вероятностную формулировку сегментации регионов.

Однако для реализации этих методов требуется большое количество высококачественных маркированных данных. Получение точных меток для интересующих областей может быть дорогостоящим и трудоемким процессом, особенно для 3D-данных. Методы полу-контролируемого обучения позволяют обучать модели, используя как помеченные, так и данные без разметки, что является многообещающим подходом для решения проблемы получения точных меток.

В данной работе представлен метод полу-контролируемого обучения для моделей с несколькими выходными данными. Метод основан на дополнительных поворотах и отражениях и не предполагает вероятностного характера ответов модели. Это делает его универсальным подходом, что особенно важно для архитектур, предполагающих раздельную сегментацию.

26 июня 2024 г.

Михайлова Людмила Викторовна
Задачи восстановления квазипериодических последовательностей по их зашумленной сумме.

Аннотация

Рассматриваются две ранее не исследованные дискретные экстремальные задачи, индуцированные задачей восстановления (разделения) двух квазипериодических последовательностей по их зашумленной сумме. В рамках доклада предполагается, каждая из суммируемых последовательностей включает в себя идентичные подпоследовательности-фрагменты заданной формы. В задаче 1 число фрагментов в последовательности является частью входных данных, а в задаче 2 подлежит определению. Конструктивно доказано, что обе задачи полиномиально разрешимы. Приведены результаты численного моделирования.

03 апреля 2024 г.

Мирошниченко Любовь Александровна
Алгоритмические аспекты анализа символьных последовательностей.

Аннотация

В докладе будут рассмотрены алгоритмические аспекты анализа символьных последовательностей произвольной языковой природы, а также их применение в различных прикладных областях. Особый интерес представляют любые проявления повторности: от локальных структурных закономерностей в бактериальных геномах до общих фрагментов из разных геномов, учитываемых при формировании матрицы попарной близости. Для решения задач, связанных с анализом и дешифровкой древнерусских знаменных песнопений методы обобщены на случай «параллельных» текстов.

21 марта 2024 г.

Рязанцев Глеб (асп. ИМ СО РАН)
Использование методов глубокого обучения на рентгеновских изображениях для диагностики спондилолистеза.

Аннотация

В докладе будет представлен новый многоэтапный алгоритм глубокого обучения для анализа медицинских рентгеновских изображений с целью локализации позвоночного столба, а затем одновременного обнаружения отдельных позвонков и количественной оценки спондилолистеза. Проводится обучение нейронной сети для всех этапов пайплайна, который включает в себя различные задачи, такие как: сегментация, детекция, классификация.

12 декабря 2023 г.

Панасенко О. В.
Аппроксимационная схема для задачи взвешенной 2-кластеризации конечной последовательности точек евклидова пространства с произвольными весами.

Аннотация

Исследуемая задача является обобщением ряда NP-трудных задач анализа данных на случай произвольных весовых множителей с дополнительными ограничениями на номера элементов кластера. Среди обобщаемых задач можно выделить такую известную задачу, как $M$-Variance (весовые множители 1 и 0), и многие задачи, которыми занимался А. В. Кельманов со своими учениками.

В докладе будет представлен приближенный алгоритм с гарантированными оценками точности и трудоемкости, реализующий схему FPTAS в случае, когда размерность пространства фиксирована.

23 ноября 2023 г.

Кальмуцкий К. О. (НГУ)
Слабо-контролируемое обучение: задачи, метод решения и примеры.

Аннотация

Слабо-контролируемое обучение представляет собой перспективное направление в машинном обучении, позволяющее сократить затраты на разметку данных, сохраняя при этом высокую эффективность обученных моделей. В докладе будут рассмотрены постановки задач, алгоритмы и методы решения, используемые в слабо-контролируемом обучении, а также практические примеры задач, где эти методы находят свое применение.