2025

Анализ неструктурированных данных

Курс рассчитан на студентов 3-4 курсов как практико-ориентированный курс для освоения основ современных технологий искусственного интеллекта.

Из всех видов обработки неструктурированных данных (текстов, изображений и др.) преимущественно рассматриваются задачи анализа текстовых данных. Изучаются инструментальные средства и базовые этапы обработки текстов на естественном языке, а также возможности векторной семантики слов в нейросетевых языковых моделях. Обзорно рассматриваются основные архитектуры нейронных сетей и средства их разработки. Показываются пути применения методов машинного обучения для решения ряда прикладных задач анализа данных.

Теоретический материал доступен в виде презентаций лекций в системе moodle, он подкрепляется практическими семинарскими занятиями и домашними работами.

Преподаватели спецкурса
Большакова Елена Игоревна
Кандидат физико-математических наук
Доцент кафедры алгоритмических языков ВМК МГУ
Доцент департамента анализа данных и искусственного интеллекта НИУ ВШЭ
Основные научные интересы: искусственный интеллект, компьютерная лингвистика, функциональные и логические языки программирования
Грацианова Татьяна Юрьевна
Кандидат физико-математических наук
Доцент кафедры алгоритмических языков ВМК МГУ
Основные научные интересы: компьютерная лингвистика, искусственный интеллект
Елисеева Мария Алексеевна
Младший научный сотрудник кафедры алгоритмических языков ВМК МГУ
Основные научные интересы: методы работы с мультимодальными системами, генерация изображений по текстам и графам сцен

Требования к слушателям

Прохождение курса требует базовых знаний математики и программирования в объеме первых двух курсов ВМК МГУ; знание языка Python3 приветствуется.