N | Название Лабораторной | Дедлайн мягкий и жесткий (включительно) | Комментарий |
---|---|---|---|
1 | Разворачивание и настройка рабочей среды | 17.02 - 24.02 | Лаба на настройку окружения |
2 | Обработка и визуализация данных | 03.03 - 10.03 | Лаба на знакомство с pandas и matplotlib |
3 | Титаник | 24.03 - 31.03 | Классическое соревнование на сайте Kaggle. Призвано познакомить с основными этапами в работе Датасаентиста |
4 | Нейросети (Еще нет в репозитории) | 07.04 - 14.04 | Знакомство с нейросетями |
5 | Проект | До конца семестра | Большой групповой проект на весь семестр. |
* | DVC (необязательная) | До конца семестра | Изучение аналога GIT'а для Датасаентистов. Упростит жизнь в работе над Проектом. |
Курс рассчитан на студентов старших курсов, готовых влиться в Data - индустрию. В рамках лабораторных мы будем рассматривать применение современных инструментов в работе с данными. Большинство задач, так или иначе, будут относиться к Науке о данных (Data Science). Мы постараемся приблизиться к промышленной разработки настолько, насколько это возможно. И предоставить вам необходимые вычислительные мощности (Сервер с GPU для нейросетей и терабайтом + памяти).
Но это не точно. Возможно, придется все делать в Colab и т.п.
-
Склонируйте (clone) проект на свой компьютер
-
В лабах могут быть ошибки - открывайте issues на Гитхабе.
-
Готовые для выполнения лабораторные находятся в master. В других ветках преподаватели ведут работу и сливают результат в master.
-
Замечания \ предложения пишите в общий чат в Телеграмме. Будем рады услышать любую критику и адаптировать курс.
-
Приветствуется и поощряется написание научных работ, связанных с Наукой о данных (курсовых и дипломов в частности). У нас много идей (даже, немного, безумных) в совершенно разных направлениях (аналитика, компьютерная графика, звук, текст и т.п.). Подобный проект будет весомой строчкой в вашем резюме и выделит на фоне конкурентов.