up

Статистическое мышление

Start date will be announced later

Start date for course enrollment has not been announced yet

  • Russian

    course language

  • от 8 до 9 недель

    course duration

  • от 6 до 8 часов в неделю

    needed to educate

Курс научит формировать альтернативный взгляд на природу окружающего мира и поможет развить навыки статистического анализа данных, а также освоить ряд методов моделирования и прогнозирования.

About

Вы познакомитесь со статистической парадигмой восприятия действительности (в качестве альтернативы причинной), а также приобретёте навыки, необходимые для успешной деятельности в современном мире, который по своей природе является статистическим (вероятностным).

Итогом обучения на курсе станет: 

  • понимание базовых концепций статистики, теории вероятностей, теории информации, обработки больших данных, планирования и оценки результатов эксперимента;

  • формирование базовых навыков обработки данных в Excel;

  • формирование базовых навыков презентации итогов анализа средствами Excel;

  • приобретение навыков сбора данных и управления качеством на основе контрольных карт Шухарта.

Курс разработан кафедрой технологического предпринимательства МФТИ-РОСНАНО совместно с АНО "еНано".

Format

8 недель обучения по 6-8 часов в неделю.

В состав курса входят видеолекции на русском языке и дополнительные материалы для самостоятельного изучения пользователями.

Разделы курса завершаются тестами на понимание материала.

Requirements

Курс не требует специальной подготовки.

Course program

Неделя 1. Статистическое мышление против причинного.

Эволюция и причинное мышление. Системное и статистическое мышление. От данных к пониманию. Инструменты системного подхода. Системная динамика. Модель черного ящика. Эмерджентные (возникающие) свойства. Измерение эмерджентных свойств. История возникновения контрольных карт. Практикум: сводные таблицы в Excel.

Неделя 2. Разведочный анализ.

Сбор данных. Генеральная совокупность и выборка. Методы выборки: детерминированная и вероятностная. Простая случайная выборка. Распределение частот, формула Стерджесcа. Типы диаграмм. Принцип Эдварда Тафти минимизации количества элементов диаграммы. Фактор лжи Эдварда Тафти. Как рассказать историю с помощью данных.

 

Неделя 3. Описательные статистики

Сводки данных. Меры центральной тенденции. Меры изменчивости. Смещенная и несмещенная оценка. Коэффициент вариации. Пакет анализа. Вычисление параметров генеральной совокупности. Распределения случайной величины. Прямые и обратные функции в Excel. Качество шести сигм. Центральная предельная теорема.

Неделя 4. Теория вероятностей

Три типа вероятностей. Вероятность события. Закон больших и малых чисел. Выборочное пространство и события. Таблица сопряженности признаков. Безусловная вероятность. Вероятность совместных событий. Вывод формулы Байеса. Байесовский подход. Оптические иллюзии. Проверка гипотез. Формула Байеса, как взвешивание и нормализация. Дерево решений или естественная частота.

Неделя 5. Статистический вывод

Взаимосвязь разведочного анализа и статистического вывода. Подход пивовара. Переход от физических к t-значениям. Функции статистики Стьюдента в Excel. Степени свободы. t-критерий. Одно- и двунаправленные тесты. Предположения и опровержения. Расчет t-значения, соответствующего заданному уровню значимости. Ошибка первого рода. Ошибка второго рода. Методы повышения статистической мощности эксперимента.

Неделя 6. Распределения с толстыми хвостами

Закон Бенфорда или закон первой цифры. Закон Ципфа. Логарифмические шкалы. Принцип Парето. Фракталы. Фрактальная размерность. Фрактальная природа экономических и социальных явлений. R/S-анализ. Асимметрия шансов. Масштабируемые и немасштабируемые профессии. Бизнес в длинном хвосте.

Неделя 7. Прогнозирование

Регрессия. Прогноз на основе экспоненциального сглаживания. Западный и восточный взгляд на тенденции. Управление по тенденциям и событиям. Использование метода Монте-Карло для расчета риска. Оптимизация методом линейного программирования. Кластерный анализ методом k-средних для сегментирования клиентской базы. Системная динамика и iThink. Прогностический анализ и Google Trends.

Неделя 8. Теория информации

Формулы Хартли и Шеннона. Информация и энтропия. Информация как алгоритм. Избыточность естественных языков. Не всё измеряется в битах. Взгляд изнутри и извне. Метод Ферми оценки нематериального. Оценка Брайера: количественное измерение неопределенности. Тест на калибровку. Дилемма заключенного. Кооперативные игры. Поведенческие финансы. Риск и неопределенность.

Неделя 9. Заключение

Knowledge

Вы научитесь

Различать основные направления разведочного анализа данных, виды выборок, шкалы данных, типы диаграмм и уместность их использования, принципы визуализации и презентации итогов анализа

Определять меры среднего и разброса, принципы их использования, отличия смещенной и несмещенной оценки, коэффициент корреляции Пирсона

Разбираться в основных типах распределений случайной величины: нормальное, Пуассона, биноминальное, центральная предельная теорема, закон больших чисел, эвристика доступности

Основам анализа больших данных: кластерный анализ, линейное программирование, регрессионный анализ, прогнозирование на основе экспоненциального сглаживания

Обрабатывать сырые данные из файлов и Интернета с использованием Power Query

Использовать основные статистические функции в Excel, формировать случайную выборку данных

Оценивать прогноз методом Брайера

Моделировать системную динамику в iThink

Моделировать методом Монте-Карло в Excel

Владеть терминологией в областях статистики, управления качеством, больших данных, теории информации

Настраивать наивный байесовский классификатор

Обрабатывать ошибки измерений в Excel на основе байесовской вероятности

Abilities

  • Цифровые навыки

    01

    Умение работать с базами данных

    02

    Умение работать и анализировать данные в программе Excel

    03

    Представление о работе в специализированной программе iThink

Будет полезно

Техническим руководителям

Бизнес-аналитикам

Руководителям проектов

Студентам и аспирантам

Курс разработан кафедрой технологического предпринимательства МФТИ-РОСНАНО совместно с АНО "еНано".

Багузин Сергей Викторович

Кандидат физико-математических наук
Position: Зам. директора по развитию