up

Машинное обучение и анализ данных

15 February - 31 May 2021 г.
The course has already started
74 days
to the end of the enrollment
  • 15 weeks

    course duration

  • about 13 hours per week

    needed to educate

  • 4 credit points

    for credit at your university

About

Машинное обучение, его применение и совершенствование — это то, над чем трудятся многие лучшие умы современности. В этом курсе расскажем и наглядно покажем современные подходы к статистической обработке данных и построению моделей в машинном обучении (МО).

Идея этого курса — пролить свет на основные задачи и методы машинного обучения. Как мы покажем, многие задачи машинного обучения — это не что-то из области фантастики. Это задачи, с которыми сталкивается каждый из нас даже просто-напросто в быту. В то же время, способы решения этих задач, конечно, основаны на математике, которую мы постараемся изложить в максимально понятной и доступной форме.

Format

В состав курса входят видео-лекциии и упражнения. Длительность курса составляет 11 недель. Трудоемкость курса – 4 зачетных единицы. Средняя недельная нагрузка на обучающегося – 13 часов.

Литература: 
    1. Флах, П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных [Электронный ресурс] / П. Флах. — Электрон. дан. — Москва : ДМК Пресс, 2015. — 400 с. — Режим доступа: https://e.lanbook.com/book/69955. — Загл. с экрана.
    2. Анализ данных : учебник для академического бакалавриата / В. С. Мхитарян [и др.] ; под ред. В. С. Мхитаряна. — М. : Издательство Юрайт, 2018. — 490 с. — (Серия : Бакалавр. Академический курс). — ISBN 978-5-534-00616-2. — Режим доступа : www.biblio-online.ru/book/CC38E97A-CCE5-4470-90F1-3B6D35ACC0B4.
    3. Миркин, Б. Г. Введение в анализ данных : учебник и практикум / Б. Г. Миркин. — М. : Издательство Юрайт, 2018. — 174 с. — (Серия : Авторский учебник). — ISBN 978-5-9916-5009-0. — Режим доступа : www.biblio-online.ru/book/46A41F93-BC46-401C-A30E-27C0FB60B9DE
Сетевые ресурсы:
    1. http://www.machinelearning.ru/ - Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных

Requirements

Для успешного освоения курса необходимы базовые навыки работы с компьютером и сетью Интернет.

Course program

В курсе рассматриваются следующие темы:

  • Основные понятия и обозначения. Постановки и прикладные примеры задач машинного обучения (обучение с учителем, обучение без учителя, обучение с подкреплением). Классификация моделей и методов машинного обучения. 
  • Основы языка Python, обзор популярных библиотек для обработки и визуализации данных: Numpy, pandas, Pyplot. Возможности, предоставляемые Azure ML Studio. 
  • Задача уменьшения размерности. Метод главных компонент. 
  • Задача регрессии. Линейная регрессия. Оценка параметров модели. Построение доверительных интервалов. Проверка гипотез. Многомерная линейная регрессия. Оценка модели. Полиномиальная регрессия. 
  • Задача классификации. Наивный Байесовский классификатор. Метод k ближайших соседей. Логистическая регрессия. Метод опорных векторов. Деревья принятия решений. Энтропия и прирост информации. Неопределенность Джини. Многоклассовая классификация.
  • Задача кластеризации. Метод К-средних, иерархическая кластеризация и дендрограммы. Ансамблевые методы. Бэггинг. Бустинг. 
  • Обучение с подкреплением. Алгоритм Q-Learning.

Education results

  • Знать о типах твердых тел, особенностях их структуры, квазичастицах и взаимодействиях между ними, об отклике (в т.ч., нелинейном) твердых тел на внешние воздействия; математические и логические выводы основных соотношений физики твердого тела; особенности физической задачи при выборе адекватного подхода для описания исследуемых физических явлений.
  • Уметь формулировать на математическом языке постановку физической задачи, исходя из твердо установленных и апробированных положений и методов теории твердого тела; анализировать критерии применимости используемых методов, подходов, моделей; выполнять феноменологические и квантово-механические расчеты параметров, характеризующих отклик конденсированной среды на внешние воздействия.
  • Владеть современным математическим аппаратом; современными информационными технологиями; основными методиками исследования в естественнонаучных дисциплинах и использовать их в своей профессиональной деятельности.
  • Знать классические методы, применяемые в ходе теоретических и экспериментальных исследований в избранной области технической физики; современные тенденции развития технической физики в своей профессиональной деятельности.
  • Уметь собирать и анализировать информацию по решаемой задаче, составлять ее математическое описание, обеспечивать накопление, анализ и систематизацию данных с использованием современных методов сбора и обработки информации; применять математические методы, физические законы и вычислительную технику для решения практических задач; выполнять измерения и экспериментальные исследования различных объектов технической физики; самостоятельно осуществлять поиск специальной литературы и выбирать эффективные методы решения согласно поставленным задачам.
  • Владеть основными элементами экспериментальных и теоретических методов физических исследований в избранной области деятельности.
  • Знать основные способы получения и обработки информации, необходимой для профессиональной деятельности.
  • Уметь обрабатывать и анализировать результаты эксперимента, проводить расчеты по экспериментальным данным с использованием компьютерных программ, самостоятельно работать на компьютере в средах современных операционных систем и наиболее распространенных прикладных программ и программ компьютерной графики.
  • Владеть навыками работы с наиболее распространенными прикладными пакетами для математической обработки экспериментальных данных; основными методами, способами и средствами получения, хранения, переработки информации. 
     

Formed competencies

  • Способность использовать фундаментальные законы природы и основные законы естественных дисциплин в профессиональной деятельности (ОПК-1)
  • Способность к теоретическим и экспериментальным исследованиям в избранной области технической физики, готовность учитывать современные тенденции развития технической физики в своей профессиональной деятельности (ОПК-3)
  • Владение основными методами, способами и средствами получения, хранения, переработки информации; способность самостоятельно работать на компьютере в средах современных операционных систем и наиболее распространенных прикладных программ и программ компьютерной графики (ОПК-5)
     

Михайлова Елена Георгиевна

К. ф.-м. н., доцент
Position: Советник при ректорате-директор по направлению "цифровая культура" Университета ИТМО, директор высшей школы цифровой культуры Университета ИТМО

Бойцев Антон Александрович

К.ф.-м.н.
Position: доцент факультета систем управления и робототехники, доцент высшей школы цифровой культуры Университета ИТМО

Волчек Дмитрий Геннадьевич

К.т.н.
Position: доцент высшей школы цифровой культуры Университета ИТМО, программист международной научной лаборатории "Интеллектуальные методы обработки информации и семантические технологии" Университета ИТМО, научный сотрудник факультета программной инженерии и компьютерной техники Университета ИТМО

Романов Алексей Андреевич

К.т.н.
Position: доцент высшей школы цифровой культуры Университета ИТМО, программист международной научной лаборатории "Интеллектуальные методы обработки информации и семантические технологии" Университета ИТМО, научный сотрудник факультета программной инженерии и компьютерной техники Университета ИТМО

course completion certificate

Certificate

По данному курсу возможно получение сертификата.

Similar courses