2024

Методы интеллектуального анализа данных на языке Python. Практикум

Область Data Mining имеет большое практическое применение. Системы интеллектуального анализа данных представляют собой класс программных систем поддержки принятия решений, задачей которых является поиск скрытых, ранее неизвестных, содержательных и потенциально полезных закономерностей в больших объемах разнородных, сложно структурированных данных.


Для получения качественных моделей необходимо провести множество этапов анализ данных: анализ предметной области, формирование и подготовка данных, формализация решаемой задачи, разработка и применение алгоритма для выявления закономерностей, валидация моделей и представление результатов анализа и применение построенных моделей на новых данных.


В рамках курса, участникам предлагается набор практических заданий в интерактивной среде программирования, нацеленных на работу с современными алгоритмами и методами интеллектуального анализа данных, а также сопровождающие методические материалы для самостоятельного ознакомления. В материалах рассматриваются области решения задач поиска

ассоциативных правил, тематического моделирования, кластеризации, классификации, поиска аномалий и прогнозирования.


В рамках курса рассматриваются транзакционные, табличные, числовые и специализированные данные.


Практические задания нацелены на решение реальных задач анализа данных на языке Python. В курсе рассматриваются процедурные, функциональные и объектно-ориентированные средства языка Python, а также современные пакеты машинного обучения. Также, выполнение заданий позволит участникам проявить умения исследовательской работы: аргументированно выбирать

модели под каждую задачу, предоставлять альтернативные способы формализации и решения задач, объяснять полученные результаты.


Для успешного прохождения курса требуется элементарное умение разработки программ на языке Python, а также знание основ математического анализа и линейной алгебры.

Преподаватели спецкурса

Васильев Юлий Алексеевич
Математик 1-й категории кафедры Интеллектуальных информационных технологий, ВМК МГУ
Основные научные интересы: интеллектуальный анализ данных (data mining), анализ выживаемости (survival analysis, time-toevent), обработка медицинских данных, адаптивные алгоритмы, модели стратификации

Петровский Михаил Игоревич
Кандидат физико-математических наук
Доцент кафедры Интеллектуальных информационных технологий ВМК МГУ
Основные научные интересы: компьютерное зрение, генеративные модели

Требования к слушателям

Курс предназначен для студентов кафедры ИИТ 4 курса бакалавриата. Для успешного прохождения курса требуется

элементарное умение разработки программ на языке Python, а также знание основ математического анализа и линейной алгебры.