О кружке Новости Туториалы Интересное
  • Семинар 2

    Линейные модели.

    Ведёт: Артём Грязев

    Конспект и материалы:

    • Презентация
    • Jupyter Notebook с семинара:
      • Ссылка для скачивания
      • Открыть на github
    • Данные
      • Коты и лемуры
      • Вес и рост

    Домашнее задание: Домашнее задание и ноутбук к нему выложены в группе Кружка ВКонтакте.

    Все пожелания отправляйте в группу!


  • Новый набор

    Кружок Прикладного Анализа Данных Физтех-школы Прикладной Математики и Информатики МФТИ открывает набор учеников на весенний семестр 2019 года. Ждём учащихся 8-11 классов, которым будет интересно увидеть применение загадочных слов “машинное обучение”, “анализ данных” и “нейронные сети” на практике.



  • Летние проекты

    Всем, кто всерьез увлекся анализом данных, мы предлагаем поучаствовать летом в работе над реальными проектами по одной из трех тем:

    1. Выяснение влияние окружающей среды на организм человека при помощи анализа RR-интервалов
    2. Прогнозирование розничной торговли
    3. Анализ художественных произведений методами машинного обучения

    Чтобы поучаствовать, необходимо написать Анастасии Зухбе в телеграмме (номер телефона: +7 985 199 31 32). Она свяжет вас с куратором выбранного проекта.


  • Лучшие из лучших

    Ещё раз спешим поздравить ребят, которые лучше всех проявили себя на нашем кружке! Продолжайте в том же духе и покоряйте новые вершины!

    Best of the best

  • Дружеские посиделки:)

    Внимание!

    В это воскресение (20.05) занятия не будет, зато будет организована последняя неформальная встреча:) Будем награждать лучших и обсуждать дальнейшие планы. Будем очень вас ждать!


  • Семинар 8

    Анализ тональности текста

    Ведёт: Анастасия Зухба

    Конспект и материалы:

    • Ссылка для скачивания архива с ноутбуком и данными
    • Открыть на github ноутбук с семинара

    Видео:


  • Отмена занятия 22.04

    Внимание! 21 апреля занятия не будет.

    Приглашаем вас приехать в МФТИ на День Открытых Дверей.

    Для ребят, которые не смогут приехать, была организована трансляция:


  • Семинар 7

    Обработка естественного языка

    Ведёт: Мария Селезнёва

    Конспект и материалы:

    • Ссылка для скачивания архива с ноутбуком и данными
    • Открыть на github ноутбук с семинара

    Видео:


  • Семинар 6

    Сравнение постановок задач

    Ведёт: Анастасия Зухба

    Конспект и материалы:

    • Ссылка для скачивания архива с ноутбуком и данными
    • Открыть на github ноутбук с семинара

    Домашнее задание:

    • Для рассмотренной в семинаре задачи прогнозирования энергопотребления построить модель, совмещающую в себе подходы временных рядов и регрессии.
    • Сравнить качество ее работы с работой предложенных в семинаре моделей регрессии и временного ряда.

    Видео:


  • Семинар 5

    Регрессия

    Ведёт: Анастасия Белозёрова

    Конспект и материалы:

    • Ссылка для скачивания архива с ноутбуком и данными
    • Открыть на github ноутбук с семинара

    Видео:


  • Семинар 4

    Внимание! 21 апреля занятия не будет.

    Приглашаем вас приехать в МФТИ на День Открытых Дверей.

    Для ребят, которые не смогут приехать, была организована трансляция:


  • Лекция 4

    Регрессия в прикладных задачах.

    Читает: Вадим Викторович Стрижов

    Профессор Кафедры интеллектуальных систем МФТИ, доктор физ.-мат. наук, научный сотрудник ВЦ ФИЦ ИУ Российский академии наук, главный редактор журнала Машинное обучение и анализ данных.

    Видео:


  • Семинар 4

    Регрессия

    Ведёт: Анастасия Зухба

    Конспект и материалы:

    • Ссылка для скачивания архива с ноутбуком и данными
    • Открыть на github ноутбук с семинара
    • Скачать данные отдельно

    Видео:


  • Семинар 3

    Классификация.

    Ведeт: Павел Темирчев, Анастасия Зухба

    Все материалы:

    • Скачать. Не забывайте, что файлы нужно будет распаковать

    Домашнее задание(выполняется на датасете ЭКГ(триграммы)):

    • Загрузить датасет и выбрать задачу двухклассовой классификации: рекоммендуется ‘AZ’ против ‘VD’. Выбрать все строки, у которых в столбике ‘AZ’ или ‘VD’ не ноль.
    • Разбить данные на обучение и контроль случайным образом. Желательно использовать kFold.
      Для тех, кто знаком с программированием: сделайте так, чтобы каждое обследование входило в обучение или контроль целиком.
    • Отобрать признаки.
    • Выбрать любые два метода классификации.
    • Сравнить их работу на полученной выборке с выбранными признаками.

    Видео:


  • Лекция 2

    Машинное обучение на примере задач распознавания языка текста и диагностики по ЭКГ.

    Читает: Константин Вячеславович Воронцов

    Доктор физико-математических наук, профессор РАН, заведующий отделом «Интеллектуальные системы» Вычислительного центра ФИЦ ИУ РАН, заведующий лабораторией машинного интеллекта МФТИ, профессор кафедры «Интеллектуальные системы» ФУПМ МФТИ, преподаватель Школы анализа данных Яндекс.

    Презентация с лекции.

    Видео:


  • Семинар 2

    Pandas. Визуализация данных.

    Ведёт: Анастасия Зухба

    Конспект и материалы:

    • Jupyter Notebook с семинара:
      • Ссылка для скачивания
      • Открыть на github
    • Данные

    Видео:

    Домашнее задание:

    • На основе равномерного распределения сгенерировать выборку, представляющую собой синий круг внутри красного квадрата.
    • Используя рассмотренные методы визуализации рассмотреть датасет f3 триграмм. Выделить информативные признаки для решения каждой из 14 задач двухклассовой классификации: ‘AZ’ против каждого из оставшихся классов.
    • Дополнительное: Проверить свою гипотезу, рассмотрев соответствующие задачи классификации

    Пройдите опрос, и мы станем ещё лучше!


  • Лекция 1

    Введение в анализ данных.

    Читает: Константин Вячеславович Воронцов

    Доктор физико-математических наук, профессор РАН, заведующий отделом «Интеллектуальные системы» Вычислительного центра ФИЦ ИУ РАН, заведующий лабораторией машинного интеллекта МФТИ, профессор кафедры «Интеллектуальные системы» ФУПМ МФТИ, преподаватель Школы анализа данных Яндекс.

    Презентация с лекции.


  • Семинар 1

    Установка Anaconda. Основы работы в Python.

    Ведёт: Анастасия Зухба

    Конспект и материалы:

    • Инструкция по установке Python (и не только:))
    • Простейшие команды и операции в Python:
      • Ссылка для скачивания
      • Открыть на github

    Домашнее задание:

    1. Установить Anaconda
    2. Открыть Jupyter Notebook
    3. Изучить семинар 1
    4. Проверить, что все команды запускаются

    О всех возникающих проблемах пишите в чат, мы с радостью вам ответим:)

    Пройдите опрос, и мы станем ещё лучше!


Контактная почта: datascienceapplied@gmail.com. Группа в VK: vk.com/applieddatascience. Телеграм-чат: Applied Data Science.