course language
course duration
needed to educate
Курс научит формировать альтернативный взгляд на природу окружающего мира и поможет развить навыки статистического анализа данных, а также освоить ряд методов моделирования и прогнозирования.
Вы познакомитесь со статистической парадигмой восприятия действительности (в качестве альтернативы причинной), а также приобретёте навыки, необходимые для успешной деятельности в современном мире, который по своей природе является статистическим (вероятностным).
Итогом обучения на курсе станет:
понимание базовых концепций статистики, теории вероятностей, теории информации, обработки больших данных, планирования и оценки результатов эксперимента;
формирование базовых навыков обработки данных в Excel;
формирование базовых навыков презентации итогов анализа средствами Excel;
Курс разработан кафедрой технологического предпринимательства МФТИ-РОСНАНО совместно с АНО "еНано".
8 недель обучения по 6-8 часов в неделю.
В состав курса входят видеолекции на русском языке и дополнительные материалы для самостоятельного изучения пользователями.
Разделы курса завершаются тестами на понимание материала.
Курс не требует специальной подготовки.
Неделя 1. Статистическое мышление против причинного.
Эволюция и причинное мышление. Системное и статистическое мышление. От данных к пониманию. Инструменты системного подхода. Системная динамика. Модель черного ящика. Эмерджентные (возникающие) свойства. Измерение эмерджентных свойств. История возникновения контрольных карт. Практикум: сводные таблицы в Excel.
Неделя 2. Разведочный анализ.
Сбор данных. Генеральная совокупность и выборка. Методы выборки: детерминированная и вероятностная. Простая случайная выборка. Распределение частот, формула Стерджесcа. Типы диаграмм. Принцип Эдварда Тафти минимизации количества элементов диаграммы. Фактор лжи Эдварда Тафти. Как рассказать историю с помощью данных.
Неделя 3. Описательные статистики
Сводки данных. Меры центральной тенденции. Меры изменчивости. Смещенная и несмещенная оценка. Коэффициент вариации. Пакет анализа. Вычисление параметров генеральной совокупности. Распределения случайной величины. Прямые и обратные функции в Excel. Качество шести сигм. Центральная предельная теорема.
Неделя 4. Теория вероятностей
Три типа вероятностей. Вероятность события. Закон больших и малых чисел. Выборочное пространство и события. Таблица сопряженности признаков. Безусловная вероятность. Вероятность совместных событий. Вывод формулы Байеса. Байесовский подход. Оптические иллюзии. Проверка гипотез. Формула Байеса, как взвешивание и нормализация. Дерево решений или естественная частота.
Неделя 5. Статистический вывод
Взаимосвязь разведочного анализа и статистического вывода. Подход пивовара. Переход от физических к t-значениям. Функции статистики Стьюдента в Excel. Степени свободы. t-критерий. Одно- и двунаправленные тесты. Предположения и опровержения. Расчет t-значения, соответствующего заданному уровню значимости. Ошибка первого рода. Ошибка второго рода. Методы повышения статистической мощности эксперимента.
Неделя 6. Распределения с толстыми хвостами
Закон Бенфорда или закон первой цифры. Закон Ципфа. Логарифмические шкалы. Принцип Парето. Фракталы. Фрактальная размерность. Фрактальная природа экономических и социальных явлений. R/S-анализ. Асимметрия шансов. Масштабируемые и немасштабируемые профессии. Бизнес в длинном хвосте.
Неделя 7. Прогнозирование
Регрессия. Прогноз на основе экспоненциального сглаживания. Западный и восточный взгляд на тенденции. Управление по тенденциям и событиям. Использование метода Монте-Карло для расчета риска. Оптимизация методом линейного программирования. Кластерный анализ методом k-средних для сегментирования клиентской базы. Системная динамика и iThink. Прогностический анализ и Google Trends.
Неделя 8. Теория информации
Формулы Хартли и Шеннона. Информация и энтропия. Информация как алгоритм. Избыточность естественных языков. Не всё измеряется в битах. Взгляд изнутри и извне. Метод Ферми оценки нематериального. Оценка Брайера: количественное измерение неопределенности. Тест на калибровку. Дилемма заключенного. Кооперативные игры. Поведенческие финансы. Риск и неопределенность.
Неделя 9. Заключение
Различать основные направления разведочного анализа данных, виды выборок, шкалы данных, типы диаграмм и уместность их использования, принципы визуализации и презентации итогов анализа
Определять меры среднего и разброса, принципы их использования, отличия смещенной и несмещенной оценки, коэффициент корреляции Пирсона
Разбираться в основных типах распределений случайной величины: нормальное, Пуассона, биноминальное, центральная предельная теорема, закон больших чисел, эвристика доступности
Основам анализа больших данных: кластерный анализ, линейное программирование, регрессионный анализ, прогнозирование на основе экспоненциального сглаживания
Обрабатывать сырые данные из файлов и Интернета с использованием Power Query
Использовать основные статистические функции в Excel, формировать случайную выборку данных
Оценивать прогноз методом Брайера
Моделировать системную динамику в iThink
Моделировать методом Монте-Карло в Excel
Владеть терминологией в областях статистики, управления качеством, больших данных, теории информации
Настраивать наивный байесовский классификатор
Обрабатывать ошибки измерений в Excel на основе байесовской вероятности
01
Умение работать с базами данных
02
Умение работать и анализировать данные в программе Excel
03
Представление о работе в специализированной программе iThink
Техническим руководителям
Бизнес-аналитикам
Руководителям проектов
Студентам и аспирантам
course language
course duration
needed to educate
Курс разработан кафедрой технологического предпринимательства МФТИ-РОСНАНО совместно с АНО "еНано".
Кандидат физико-математических наук
Position: Зам. директора по развитию