-
Семинар 2
Линейные модели.
Ведёт: Артём Грязев
Конспект и материалы:
- Презентация
- Jupyter Notebook с семинара:
- Данные
Домашнее задание: Домашнее задание и ноутбук к нему выложены в группе Кружка ВКонтакте.
-
Новый набор
Кружок Прикладного Анализа Данных Физтех-школы Прикладной Математики и Информатики МФТИ открывает набор учеников на весенний семестр 2019 года. Ждём учащихся 8-11 классов, которым будет интересно увидеть применение загадочных слов “машинное обучение”, “анализ данных” и “нейронные сети” на практике.
-
Летние проекты
Всем, кто всерьез увлекся анализом данных, мы предлагаем поучаствовать летом в работе над реальными проектами по одной из трех тем:
- Выяснение влияние окружающей среды на организм человека при помощи анализа RR-интервалов
- Прогнозирование розничной торговли
- Анализ художественных произведений методами машинного обучения
Чтобы поучаствовать, необходимо написать Анастасии Зухбе в телеграмме (номер телефона: +7 985 199 31 32). Она свяжет вас с куратором выбранного проекта.
-
Лучшие из лучших
Ещё раз спешим поздравить ребят, которые лучше всех проявили себя на нашем кружке! Продолжайте в том же духе и покоряйте новые вершины!
-
Дружеские посиделки:)
Внимание!
В это воскресение (20.05) занятия не будет, зато будет организована последняя неформальная встреча:) Будем награждать лучших и обсуждать дальнейшие планы. Будем очень вас ждать!
-
Семинар 8
Анализ тональности текста
Ведёт: Анастасия Зухба
Конспект и материалы:
Видео:
-
Отмена занятия 22.04
Внимание! 21 апреля занятия не будет.
Приглашаем вас приехать в МФТИ на День Открытых Дверей.
Для ребят, которые не смогут приехать, была организована трансляция:
-
Семинар 7
Обработка естественного языка
Ведёт: Мария Селезнёва
Конспект и материалы:
Видео:
-
Семинар 6
Сравнение постановок задач
Ведёт: Анастасия Зухба
Конспект и материалы:
Домашнее задание:
- Для рассмотренной в семинаре задачи прогнозирования энергопотребления построить модель, совмещающую в себе подходы временных рядов и регрессии.
- Сравнить качество ее работы с работой предложенных в семинаре моделей регрессии и временного ряда.
Видео:
-
Семинар 5
Регрессия
Ведёт: Анастасия Белозёрова
Конспект и материалы:
Видео:
-
Семинар 4
Внимание! 21 апреля занятия не будет.
Приглашаем вас приехать в МФТИ на День Открытых Дверей.
Для ребят, которые не смогут приехать, была организована трансляция:
-
Лекция 4
Регрессия в прикладных задачах.
Читает: Вадим Викторович Стрижов
Профессор Кафедры интеллектуальных систем МФТИ, доктор физ.-мат. наук, научный сотрудник ВЦ ФИЦ ИУ Российский академии наук, главный редактор журнала Машинное обучение и анализ данных.
Видео:
-
Семинар 4
Регрессия
Ведёт: Анастасия Зухба
Конспект и материалы:
- Ссылка для скачивания архива с ноутбуком и данными
- Открыть на github ноутбук с семинара
- Скачать данные отдельно
Видео:
-
Семинар 3
Классификация.
Ведeт: Павел Темирчев, Анастасия Зухба
Все материалы:
- Скачать. Не забывайте, что файлы нужно будет распаковать
Домашнее задание(выполняется на датасете ЭКГ(триграммы)):
- Загрузить датасет и выбрать задачу двухклассовой классификации: рекоммендуется ‘AZ’ против ‘VD’. Выбрать все строки, у которых в столбике ‘AZ’ или ‘VD’ не ноль.
- Разбить данные на обучение и контроль случайным образом.
Желательно использовать kFold.
Для тех, кто знаком с программированием: сделайте так, чтобы каждое обследование входило в обучение или контроль целиком. - Отобрать признаки.
- Выбрать любые два метода классификации.
- Сравнить их работу на полученной выборке с выбранными признаками.
Видео:
-
Лекция 2
Машинное обучение на примере задач распознавания языка текста и диагностики по ЭКГ.
Читает: Константин Вячеславович Воронцов
Доктор физико-математических наук, профессор РАН, заведующий отделом «Интеллектуальные системы» Вычислительного центра ФИЦ ИУ РАН, заведующий лабораторией машинного интеллекта МФТИ, профессор кафедры «Интеллектуальные системы» ФУПМ МФТИ, преподаватель Школы анализа данных Яндекс.
Видео:
-
Семинар 2
Pandas. Визуализация данных.
Ведёт: Анастасия Зухба
Конспект и материалы:
- Jupyter Notebook с семинара:
- Данные
Видео:
Домашнее задание:
- На основе равномерного распределения сгенерировать выборку, представляющую собой синий круг внутри красного квадрата.
- Используя рассмотренные методы визуализации рассмотреть датасет f3 триграмм. Выделить информативные признаки для решения каждой из 14 задач двухклассовой классификации: ‘AZ’ против каждого из оставшихся классов.
- Дополнительное: Проверить свою гипотезу, рассмотрев соответствующие задачи классификации
-
Лекция 1
Введение в анализ данных.
Читает: Константин Вячеславович Воронцов
Доктор физико-математических наук, профессор РАН, заведующий отделом «Интеллектуальные системы» Вычислительного центра ФИЦ ИУ РАН, заведующий лабораторией машинного интеллекта МФТИ, профессор кафедры «Интеллектуальные системы» ФУПМ МФТИ, преподаватель Школы анализа данных Яндекс.
-
Семинар 1
Установка Anaconda. Основы работы в Python.
Ведёт: Анастасия Зухба
Конспект и материалы:
- Инструкция по установке Python (и не только:))
- Простейшие команды и операции в Python:
Домашнее задание:
- Установить Anaconda
- Открыть Jupyter Notebook
- Изучить семинар 1
- Проверить, что все команды запускаются
О всех возникающих проблемах пишите в чат, мы с радостью вам ответим:)