47 курсов по Data Science и Data Scientist доступных для прохождения в 2024 году
Список курсов кратко:
- 1. Курс «Профессия Data Scientist: машинное обучение» — Skillbox
- 2. Курс «Профессия Data Scientist PRO» — Skillbox
- 3. Курс «Факультет искусственного интеллекта» — GeekBrains
- 4. Курс «Data Scientist: с нуля до middle» — Нетология
- 5. Курс «Data Science» — Бруноям
- 6. Курс «Основы Data Science» — ООО «Образовательный центр программирования и высоких технологий»
- 7. Курс «Профессия Data Scientist» — Skillbox
- 8. Курс «Data Science» — Skill-Branch
- 9. Курс «DataGym» — ИП Ермаков П. Д.
- 10. Курс «Data Scientist: с нуля до middle» — Нетология
- 11. Курс «Факультет искусственного интеллекта» — GeekBrains
- 12. Курс «Data Science» — SF Education
- 13. Курс «Профессия Data Scientist» — SkillFactory
- 14. Курс «Data Science» — Школа анализа данных
- 15. Курс «Профессия: Data Scientist» — ProductStar
- 16. Курс «BIG DATA SCIENCE» — Сетевая академия Ланит
- 17. Курс «Data Science/Machine Learning Fundamentals» — ООО «СофтЛайнбел»
- 18. Курс «Data Scientist» — Нетология
- 19. Курс «Data Science. Уровень 1: Основные технологии. Python для анализа данных» — Московский Государственный Технический Университет им. Н.Э. Баумана
- 20. Курс «Профессия Data Scientist: машинное обучение» — Skillbox
- 21. Курс «Data Science и Machine Learning» — bigdataschool
- 22. Курс «NLP-разработчик» — GeekBrains
- 23. Курс «Data Science » — ABLE
- 24. Курс «Data Science Academy» — Sf.Education
- 25. Курс «Data Science» — SkillFactory
- 26. Курс «Data Science / Python / Machine learning» — Digital Technologies School
- 27. Курс «Data Science для не data scientist-ов» — CROC
- 28. Курс «Data Science» — OTUS
- 29. Курс «Data Science. Уровень 1. Инструменты и технологии» — «Специалист» при МГТУ им.Н.Э.Баумана
- 30. Курс «Data Science: быстрый старт» — ProductStar
- 31. Курс «Data Science для не data scientist-ов» — CROC Education solutions
- 32. Курс «Машинное обучение» — Stanford (Coursera)
- 33. Курс «Специалист по Data Science» — НИУ ВШЭ
- 34. Курс «Data Science / Machine Learning Fundamentals» — ITEA
- 35. Курс «Профессия Data Scientist: анализ данных» — Skillbox
- 36. Курс «Data Science» — Центр компьютерного обучения «Специалист» при МГТУ им.Н.Э.Баумана
- 37. Курс «Data Science» — DataWorkshop
- 38. Курс «Deep Learning. Basic» — Otus
- 39. Курс «Data Scientist – работа настоящего и будущего» — ISsoft Solutions
- 40. Курс «Data Science» — ООО «ЭйДжей ТехФин Групп»
- 41. Курс «Data Science / Machine Learning Fundamentals» — Online Itea
- 42. Курс «Python для Data Science» — robot_dreams
- 43. Курс «Машинное обучение и анализ данных» — АНО ДПО «ШАД»
- 44. Курс «Big data для банков и телекома» — SkillFactory
- 45. Курс «Как стать специалистом по Data Science» — АНО ДПО «ШАД»
- 46. Курс «Факультет аналитики Big Data» — GeekBrains
- 47. Курс «Как стать специалистом по Data Science» — Яндекс.Практикум
Вы научитесь создавать аналитические системы и использовать алгоритмы машинного обучения, освоите работу с нейросетями. Наполните портфолио и получите престижную профессию.
- Длительность 19 месяцев
- Помощь в трудоустройстве
- 7 курсов в одной программе
- Доступ к курсу навсегда
На рынке не хватает специалистов по Data Science
- 500 компаний,
включая Сбербанк, Яндекс и Тинькофф, ищут специалистов по Data Science
- 100 000 рублей
зарплата начинающего специалиста
Кому подойдёт этот курс
- Людям без подготовки в IT
Вы получите базовые навыки по программированию, аналитике, статистике и математике, которые откроют путь к карьере в Data Science и Machine Learning. Сможете использовать свои знания сразу на практике.
- Программистам
Вы прокачаете свои знания и навыки в программировании на Python и R. Подтянете математику и умение мыслить как аналитик, использовать алгоритмы машинного обучения для решения бизнес-задач — и усилите портфолио мощными проектами.
- Менеджерам и владельцам бизнеса
Научитесь использовать данные для построения прогнозов и оптимизации бизнес-процессов и переведёте компанию на новый уровень.
Чему вы научитесь
- Программировать на Python
Освоите самый популярный язык для работы с данными.
- Визуализировать данные
Сможете разрабатывать дашборды или интерактивную инфографику.
- Работать с библиотеками и базами данных
Научитесь работать с библиотеками Pandas, NumPy и Matpotlib и освоите базы данных PostgreSQL, SQLite3, MongoDB.
- Применять нейронные сети для решения реальных задач
Освоите фреймворки для обучения нейронных сетей Tensorflow и Keras. Узнаете, как устроены нейронные сети для задач компьютерного зрения и лингвистики.
- Строить модели машинного обучения
Изучите разные алгоритмы, научитесь решать задачи регрессии, классификации и кластеризации.
- Создавать рекомендательные системы
Построите рекомендательную систему и добавите её в своё портфолио.
Помогаем построить карьеру мечты
Вас ждёт индивидуальная карьерная консультация, помощь в оформлении резюме и портфолио. На основе ваших пожеланий подберём подходящие вакансии, подготовим к собеседованию и сделаем всё, чтобы вы получили оффер.
За 2021 год мы трудоустроили более 1000 студентов на работу по новой профессии
Программа
Вас ждут 7 курсов с разным уровнем сложности, знание которых можно приравнять к году работы.
- 82 тематических модуля
- 288 онлайн-уроков
- Python для Data Science
- Введение в Data Science
- Введение в Python
- Основы
- Операторы, выражения
- Условный оператор if, ветвления
- Условный оператор if: продолжение
- Цикл while
- For: циклы со счетчиком
- For: циклы со счетчиком, часть 2. Функция range
- Цикл for: работа со строками
- Вложенные циклы
- Числа с плавающей точкой (int/float)
- Функции
- float 2
- Установка и настройка IDE
- Базовые коллекции: Cписки
- Методы для работы со списками
- List comprehensions
- Базовые коллекции: Строки
- Базовые коллекции: словари и множества
- Базовые коллекции: Кортежи
- Функции — Рекурсия
- Работа с файлами
- Исключения: работа с ошибками
- Введение в ООП
- Основные принципы ООП
- Итераторы и генераторы
- Аналитика. Начальный уровень
- Библиотека NumPy: методы анализа массивов
- Библиотека NumPy: способы преобразования массивов
- Библиотека pandas: индексация и выбор данных
- Библиотека pandas: применение функций, группировка, сортировка
- Основы визуализации данных с помощью Matplotlib
- Продвинутая визуализация с Matplotlib
- Визуализация с Seaborn
- Мастер-класс: разведочный анализ (EDA)
- Курсовая работа. Подготовка аналитического отчёта на основе имеющихся данных в качестве помощи продюсерам образовательных программ эффективно выстраивать стратегию по обновлению и улучшению курсов
- Чтение и запись данных: CSV, XLSX
- Основы SQL
- Чтение и запись данных: JSON, MongoDB
- Работа со строками
- Курсовая работа. Часть 1. Подготовка аналитического отчёта для HR-отдела. На основе аналитики необходимо составить рекомендации для отдела кадров по стратегии набора персонала и взаимодействию с сотрудниками
- Курсовая работа. Часть 2. подготовка аналитического отчёта для SMM-отдела компании Skillbox на основе паблика Skillbox «ВКонтакте»
- Статистика и теория вероятностей
- Основы статистики и теории вероятностей
- Как врать при помощи статистики
- Основы математики для Data Science
- Базовые математические объекты и SymPy. Дроби и преобразования
- Базовые математические объекты и SymPy. Функции и дополнительные объекты
- Функции одной переменной, их свойства и графики
- Интерполяция и полиномы: квадратичные и кубические функции
- Аппроксимация и преобразование функций: сдвиги, растяжения, сжатия
- Аппроксимация и работа с производными
- Функции нескольких переменных, их свойства и графики
- Частные производные функции нескольких переменных
- Векторы и матрицы. Градиент
- Линейная регрессия и системы линейных уравнений
- Разложение матриц. Собственные векторы и значения
- Машинное обучение. Начальный уровень
- Основные концепции Machine Learning (ML)
- Жизненный цикл ML-проекта
- Регрессия: метрики качества, преобразование входных данных
- Регрессия: регуляризация и градиентный спуск
- Классификация: kNN, наивный байесовский классификатор, деревья решений
- Классификация: метрики качества классификации и многоклассовая классификация
- Кластеризация
- Дополнительные техники: понижение размерности
- Дополнительные техники: бустинг и стекинг
- Знакомство с Kaggle
- Курсовая работа. Проанализировать данные телекоммуникационной компании и спрогнозировать отток пользователей на основе демографических характеристик, услуг, которыми они пользуются, длительности пользования услугами, метода и размера оплаты
- Машинное обучение. Средний уровень
- Введение в нейронные сети
- Обучение нейронных сетей
- Нейронные сети на практике
- Свёрточные нейросети для задачи классификации изображений: введение в свёртки (многоканальные свёртки, рецептивное поле)
- Свёрточные нейросети для задачи классификации изображений: продвинутые операции со свёрткой (архитектуры сетей VGG и ResNet, задача Transfer Learning для свёрточных сетей)
- Семантическая сегментация: слабая локализация и полносвёрточные нейросети (FCN)
- Семантическая сегментация: продвинутые архитектуры FCN для семантической сегментации
- Детектирование объектов. Задачи классификации и локализации
- Детектирование объектов. Анализ и реализация R-CNN-архитектуры
- Детектирование объектов. Разбор популярных архитектур (Fast/Faster R-CNN, YOLO, SSD) и знакомство с TensorFlow Object Detection API
- От дискриминативных моделей к генеративным. Style transfer
- Генеративные состязательные сети
- Введение в NLP
- NLP на нейросетях. Рекуррентные нейросети, классификация текстов
- NLP на нейросетях. Языковые модели, Attention, Transformer
- Обучение с подкреплением. Q-Learning
- Обучение с подкреплением. Deep Q-Learning
- Ускорение и оптимизация нейронных сетей
- Внедрение DL моделей в production
- Введение в рекомендательные системы и задачи ранжирования
- Современные подходы к построению рекомендательных систем
- Универсальные знания программиста
- Как стать первоклассным программистом
- Вёрстка email-рассылок. Советы на реальных примерах
- The state of soft skills
- Как мы создавали карту развития для разработчиков
- Как общаться по email и эффективно работать с почтой
- Повышение своей эффективности
- Спор о первом языке программирования
- Саморазвитие: как я не усидел на двух стульях и нашёл третий
- Data-driven подход к продуктивности — инсайты из данных миллиона людей
- Протокол HTTP
- Введение в алгоритмы
- Английский для IT-специалистов
- IT Resume and CV
- Job interview: questions and answers
- Teamwork
- Workplace communication
- Business letter
- Software development
- System concept development and SRS
- Design
- Development and Testing
- Deployment and Maintenance
Ваше резюме после обучения
- Должность Специалист по машинному обучению
- Зарплата от:100 000 ₽
Профессиональные навыки:
- Владение Python для машинного обучения
- Применение алгоритмов машинного обучения
- Работа с различными источниками данных: CSV, XML и XLS
- Написание рекомендательных систем
- Работа с базами данных MongoDB, PostgreSQL, SQLite3 и SQL
- Работа с нейронными сетями
- Работа с библиотеками pandas, numpy, matplotlib
Диплом Skillbox
Подтвердит, что вы прошли курс, и станет дополнительным аргументом при устройстве на работу.
- Три специализации на выбор
- Проекты на основе реальных задач
- Трудоустройство во время учёбы
- Преподаватели эксперты из сферы Data Science.
Специалисты по Data Science работают с Big Data, выдвигают гипотезы и проверяют их, помогают бизнесу принимать решения на основе анализа данных.
Они создают модели машинного обучения, тренируют нейросети для работы с текстом, видео или изображениями, строят поисковые и рекомендательные системы, разворачивают и поддерживают инфраструктуру для автоматизации работы с данными.
Кому подойдёт этот курс:
- Новичкам
С нуля освоите Python, SQL, научитесь собирать и анализировать данные, получите необходимый теоретический минимум по математике, теории вероятности и статистике. Знания закрепите на практике — решите задачи на основе реальных кейсов и добавите проекты в портфолио. Устроитесь на стажировку по выбранной специальности уже во время обучения. - Программистам
Подтянете математику, статистику, аналитическое и алгоритмическое мышление, научитесь выявлять потребности бизнеса. Получите опыт работы с моделями машинного обучения, будете применять Python для решения задач с данными. Пройдёте процесс от сбора данных до деплоя модели. - Начинающим аналитикам
Вы научитесь выдвигать гипотезы и делать выводы на основе данных. Сможете писать эффективный код на Python, превращать сырые данные в полезную информацию для компании, понимать математику на основе статистики, обучать машины и прогнозировать результаты. Отшлифуете знания, увеличите скорость своей работы и добьётесь повышения.
Кем вы станете после курса?
Вариант 1. Специалист по Machine Learning
Будете анализировать большие объёмы информации, создавать модели для прогнозирования в бизнесе, медицине, промышленности. Обучать нейросети, создавать аналитические системы и рекомендательные сервисы на основе алгоритмов машинного обучения. Продолжите профессиональное развитие в сфере обработки естественного языка или Computer Vision.
Вариант 2. Дата-инженер
Будете разворачивать программную инфраструктуру для организации сбора, обработки и хранения данных. Вам предстоит решать сложные, но интересные задачи: создавать отказоустойчивые системы для работы с Big Data, писать эффективный код на Python и SQL-запросы, автоматизировать рутину, «общаться» с базами данных, работать с облачными платформами.
Вариант 3. Аналитик данных
Будете помогать бизнесу принимать верные решения на основе данных. Собирать информацию и анализировать её, находить аномалии в метриках. На основе исследований будете выявлять закономерности, строить гипотезы и проверять их жизнеспособность с помощью моделирования. Научитесь визуализировать результаты работы в виде графиков и диаграмм.
Программа
Вас ждут 15 курсов с различным уровнем сложности, онлайн-лекции и практика.
3 специализации, 3 бонусных курса
Первая ступень
- Введение в Data Science
- Познакомитесь с основными направлениями Data Science, узнаете, какие задачи решают дата-аналитики, дата-инженеры и специалисты по машинному обучению.
- Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Освоите базовые инструменты для работы: Python, SQL, Excel, Power Bi, Airflow.
- Основы статистики и теории вероятностей
- Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез.
- Основы математики для Data Science
- Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и вектора. Научитесь работать с математическими сущностями в Python-библиотеке SymPy.
Специализации на выбор
- Machine Learning
- Machine Learning. Junior. Познакомитесь с алгоритмами машинного обучения для решения задач регрессии, классификации и кластеризации. Построите и обучите свою первую нейронную сеть. Научитесь подбирать параметры модели, оценивать качество и улучшать её, а также выводить результат в Production.
- Machine Learning. Advanced. Освоите алгоритмы для построения рекомендательных систем и прогнозирования временных рядов. Научитесь применять ансамблевые методы, стекинг, бустинг, а также лучшие практики кросс-валидации, мониторинга и пайплайна ML-разработки.
- Deep Learning. Научитесь работать с нейросетями: подробно узнаете, как они устроены, будете обучать модели, строить и тестировать архитектуры, передавать данные в нейросеть и настраивать параметры.
- Трек 1. NLP. Научитесь применять алгоритмы машинного обучения и нейронные сети для обработки естественного языка. Узнаете, как анализировать тональность текстов, классифицировать их, распознавать речь.
- Трек 2. Computer Vision. С помощью алгоритмов машинного обучения и нейросетей будете распознавать объекты, лица и эмоции, классифицировать и сегментировать изображения. Научитесь применять и адаптировать готовые модели CV для своих целей.
- Data Engineer
- Data Engineer. Junior. Будете собирать сложные наборы данных, подготавливать витрины данных, разворачивать DS-проекты с нуля, тестировать код, выстраивать пайплайны для работы с данными и работать в команде.
- Data Engineer. Advanced. Научитесь пользоваться типовыми средствами мониторинга, настраивать алерты. Будете выбирать архитектуру для хранения данных и работать со сложными типами архитектуры хранилищ. Выстраивать инфраструктуру и пайплайны для обучения ML-моделей.
- Data Analyst
- Data Analyst. Junior. Познакомитесь с базовыми методами анализа на примере анализа продаж. Пройдёте основы маркетинговой, BI и продуктовой аналитики. Прокачаете навыки работы в Excel, Python и Power BI. Будете уметь формулировать и тестировать гипотезы и презентовать результаты заказчику.
- Трек 1. Product Analytics. Будете обрабатывать данные, исследовать взаимодействие пользователей с продуктом, интерпретировать собранную информацию. Полученные результаты помогут решить задачи бизнеса.
- Трек 2. Marketing Analytics. Узнаете, как настраивать веб- и сквозную аналитику, создавать воронки продаж, анализировать поведение пользователей на сайте.
- Трек 3. BI Analytics. Научитесь создавать хранилища данных, проектировать базы данных на языке SQL и работать с таблицами на продвинутом уровне. Будете решать бизнес-задачи с помощью аналитики, чистить данные, правильно их хранить и визуализировать.
Дипломные проекты
- Machine Learning
- Соревнование в Kaggle.
- Командная работа в проекте.
- Data Engineer
- Индивидуальный проект.
- Хакатон.
- Data Analyst
- Командный проект.
- Индивидуальное исследование.
Бонусные курсы
- Карьера разработчика: трудоустройство и развитие
Узнаете, как выбрать подходящую вакансию, подготовиться к собеседованию и вести переговоры с работодателем. Сможете быстрее получить должность, которая соответствует вашим ожиданиям и умениям. - Система контроля версий Git
Научитесь версионировать изменения в коде, создавать и управлять репозиториями, ветками, разрешать конфликты версий. Узнаете полезные правила работы с Git. - Английский для IT-специалистов
Получите языковые навыки, которые помогут пройти собеседование в иностранную компанию и комфортно общаться в смешанных командах.
После учебы вы сможете работать по специальностям
- Data Scientist
- Data Analyst
- Machine Learning Engineer
- Computer Vision-специалист
- NLP-специалист.
У курса два формата обучения:
- живые вебинары;
- видеолекции в записи.
Программа обучения
Подготовительные курсы
Их необязательно проходить, но они помогут лучше погрузиться в обучение.
- Видеокурс: как учиться эффективно
- Основы математики
- Основы программирования
- Основы языка Python
- Базовый курс
I четверть. Программирование
Научитесь работать в Linux и создавать сервера в облачных сервисах AWS, проводить поиск информации и основные операции с файлами, выполнять мониторинг работы сервера. Научитесь использовать язык запросов SQL, создавать и оптимизировать сложные запросы. Освоите библиотеки языка Python, предназначенные для Data Science: Numpy, Pandas, Matplotlib, SciKit-Learn.
- Встреча декана со студентами
- Основы языка Python
- Рабочая станция
- Основы реляционных баз данных и MySQL
- Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
II четверть. Сбор данных и статистическое исследование
Познакомитесь с теорией вероятностей и математической статистикой. Изучите методы проведения корреляционного, дисперсионного и регрессионного анализа. Научитесь работать с RESTful/SOAP-сервисами, форматами XML и JSON в Python, а также познакомитесь с особенностями открытых данных (OpenData).
- Библиотеки Python для Data Science: продолжение
- Методы сбора и обработки данных из сети Интернет
- Введение в математический анализ
- Теория вероятностей и математической статистике
III четверть. Математика для Data Scientist
Рассмотрите математические аспекты алгоритмов, применяемых в Data Science: линейная и логистическая регрессия, градиентный спуск, метод ближайших соседей, кластеризация, деревья решений, случайный лес, градиентный бустинг. Поймете, как устроены алгоритмы на уровне математики.
- Линейная алгебра
- Алгоритмы анализа данных
IV четверть. Машинное обучение
Освоите Python: от основ программирования до автоматизации, сбора, обработки, анализа и визуализации данных.
- Машинное обучение в бизнесе
- Рекомендательные системы
- Видеокурс от Мегафон + курсовой проект
V четверть. Нейронные сети
Научитесь решать задачи Machne Learning с данными из соцсетей, геоданными, применением графов, а также познакомитесь с нейронными сетями. На практике познакомитесь с фреймворками для разработки нейронных сетей: Tensorflow, Keras, PyTorch.
- Введение в нейронные сети
- Фреймворк PyTorch для разработки искусственных нейронных сетей.
VI четверть. Задачи искусственного интеллекта
Изучите продвинутые архитектуры сверточных нейронных сетей, обработку естественного языка и компьютерное зрение.
- Введение в обработку естественного языка
- Глубокое обучение в компьютерном зрении
II четверть. Специализация
Изучите фреймворк PyTorch и углубитесь в работу с компьютерным зрением и обработкой естественного языка.
- Введение в компьютерное зрение от Nvidia
- Фреймворк PyTorch для разработки искусственных нейронных сетей
- Введение в обработку естественного языка
Курсы вне четверти
Предметы с индивидуальным выбором даты старта
- Подготовка к поиску работы
- История развития искусственного интеллекта
- Алгоритмы и структуры данных на Python
- Введение в высшую математику
- Спортивный анализ данных. Платформа Kaggle
- Язык R для анализа данных
- Визуализация данных в Tableau
- Сверточные нейронные сети в компьютерном зрении.
Вы получите диплом о профессиональной переподготовке
Для работодателя это показатель, что вы разобрались в Data Science и самостоятельно выполнили проекты из вашего портфолио.
Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.
Обучение на курсе поможет вам:
- Перейти в профессию с высоким окладом, которая не устареет через 10 лет
Положите начало своему развитию в востребованной во всех отраслях бизнеса профессии - Освоить ключевые технологии и опередить запрос рынка
Станете востребованным специалистом уже в процессе обучения и не растеряете накопленные знания и навыки - Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
Получите знания в концентрированном формате и с обратной связью от экспертов-практиков ведущих компаний.
Чему вы научитесь:
- Работать с SQL
Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов - Использовать Python и библиотеки
Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, полученные при анализе данных - Проверять данные и определять проблемы
Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки - Обучать многослойные нейронные сети и строить модели машинного обучения
Быстро строить модели и проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных - Применять математику в алгоритмах
Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями - Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком
Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения.
Программа курса:
1 ступень. Погружение
В первом модуле вы разберётесь, что такое аналитическое мышление, и узнаете, откуда берутся данные. Научитесь определять ключевые продуктовые метрики и создавать дашборды.
- Аналитическое мышление
Научитесь думать, как аналитик и формулировать гипотезы для проверки. Поймёте, что аналитика строится вокруг данных. Познакомитесь с базовым инструментом аналитика и сможете проводить в нём простой анализ данных. - Основы визуализации данных
Поймёте, как создавать наглядные интерактивные дашборды для анализа бизнес-метрик в онлайн-режиме. Научитесь определять ключевые продуктовые метрики и создавать дашборды.
2 ступень. SQL, Python и Big Data
Вы получите ключевые навыки специалиста в Data Science для старта в профессии и сможете искать стажировку в новой сфере уже после прохождения первой ступени.
- SQL и получение данных
В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать. - Аналитика больших данных
Узнаете, как собрать и управлять командой Big Data-проекта. Освоите подход CRISP-DM, определите компетенции и состав команды. Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под Big Data в своей компании. Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность. - Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python. - Математика для анализа данных
Изучите основные операции с векторами, матричными операциями. Рассмотрите генетические алгоритмы, алгоритм дифференциальной эволюции. Узнаете, что такое математическое ожидание, дисперсия и моменты старших порядков. Изучите закон больших чисел.
3 ступень. Машинное обучение, Deep Learning и нейронные сети
Получите расширенные знания в профессии и научитесь работать с нейронным сетями, обучать модели и реализовывать NLP. Начнёте повышать свою квалификацию. После окончания этой ступени сможете претендовать на позицию Junior Data Scientist и совмещать учёбу с работой.
- Машинное обучение
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации. - Рекомендательные системы
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их. - Временные ряды
Вы изучите элементарные алгоритмы обработки временных рядов, модели ARIMA и GARCH, прогнозирование значений на их основе. Узнаете, что такое марковские случайные процессы и марковские модели для временных рядов. - Нейронные сети
Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP. - Компьютерное зрение
Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов. - Обработка естественного языка
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты. - Deep Learning
Научитесь работать с многомерными свёртками, овладеете конкурентным преимуществом в задачах с использованием Beam-Search и Teacher Forcing, сможете реализовывать NLP с нуля. Сможете отличать дескриминатор от генератора и обучать генератор выбирать данные из линейной регрессии. Реализуете сеть генерации покемонов и обучите её.
4 ступень. Soft Skills и управление проектами
Сочетание хард- и софт-скиллов поможет вам быстрее расти по карьерной лестнице и добиваться больших результатов. Пройдя все ступени программы, вы сможете претендовать на должность Middle Data Scientist.
- Менеджмент data-проектов
Овладеете методологиями управления Data Science-проектами. Научитесь формулировать идеи и гипотезы, выбирать подходящие методы и алгоритмы, планировать решение задачи. - Эффективные коммуникации и эмоциональный интеллект
Научитесь понимать картину мира окружающих и на основе этого строить коммуникацию. Разберётесь, как управлять своими эмоциями, как реагировать на эмоции окружающих в процессе общения и развивать эмоциональный интеллект. Узнаете, как управлять эмоциями в переговорах. Научитесь заводить полезные связи и деловые знакомства и правильно презентовать себя. - Переговоры
Научитесь грамотно организовывать деловые встречи и эффективно проводить переговоры, добиваясь взаимовыгодных договорённостей. - Публичные выступления
Узнаете, как презентовать идею или отчёт. Научитесь получать удовольствие от выступлений и перестанете их бояться. - Финальный хакатон и Kaggle Competitions
В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Вашу квалификацию подтвердит диплом о профессиональной переподготовке.
Курсы по Data Science:
- «Data Scientist»
Освойте самую востребованную профессию 2021 года. Начните свой путь в Data Science уже сейчас. - «Data Science»
Погрузитесь в Data Science — научитесь выявлять закономерности в данных и создавать модели для решения бизнес-задач в технологических компаниях - «Математика для Data Science»
Прокачайтесь в математике и статистике для Data Science — уверенно решайте нетиповые задачи и успешно проходите собеседования в IT-компании - «Data Engineering»
Освойте Data Engineering — научитесь собирать данные из разных источников, помогайте аналитикам строить гипотезы и принимать бизнес-решения - «Нейронные сети»
Освойте машинное обучение и программирование нейронных сетей — используйте силу Deep Learning для решения бизнес-задач - «Машинное обучение и нейронные сети»
Используйте возможности алгоритмов в нужной вам сфере — продажах, медицине, банковских услугах или на производстве.
Курсы:
- Spark Developer
- NoSQL
- DataOps Engineer
- Специализация «Системный аналитик»
- Математика для Data Science
- Machine Learning. Basic
- Специализация Machine Learning
- Data Engineer
- Machine Learning. Professional
- Machine Learning. Advanced
- Data Warehouse Analyst
- Промышленный ML на больших данных
- Компьютерное зрение
- Супер-практикум по использованию и настройке GIT
- Deep Learning
- Супер-интенсив «Tarantool»
- Анализ данных и машинное обучение в MATLAB.
«Специалист по Data Science» — это программа по анализу данных и машинному обучению, которая охватывает все разделы современного анализа данных, в том числе глубинное обучение и его применения.
Программа начинается с самых основ — изучения программирования и базовых разделов математики — и переходит к разделам по машинному обучению, прикладной статистике и обработке данных, работе с большими данными, глубинному обучению, его применениям к изображениям, текстам и сигналам. При разработке программы мы сделали акцент на практическую работу.
По итогам программы вы получите самые актуальные знания в одной из самых востребованных областей 21 века, проекты в портфолио и диплом о профессиональной переподготовке установленного НИУ ВШЭ образца.
Программа:
- Python для автоматизации и анализа данных
18 занятий - Математика для анализа данных
19 занятий - Прикладная статистика для машинного обучения
9 занятий - Алгоритмы и структуры данных
10 занятий - Машинное обучение
14 занятий - Промышленное машинное обучение на Spark
8 занятий - Глубинное обучение
10 занятий - Прикладные задачи анализа данных
10 занятий.
Data Science – это наука о данных, которая занимается сбором, представлением, обработкой и анализом данных в цифровой форме, а главное – помогает выделять из общего массива данных полезную информацию. Она связана с такими направлениями как Big Data, машинное обучение и анализ данных и еще целым рядом современных ИТ-направлений.
Специалисту, который занимается такой работой (Data Scientist), нужны знания и навыки сразу в нескольких областях:
- математика и статистика,
- программирование,
- машинное обучение,
- работа с базами данных,
- визуализация данных.
Чем занимается специалист Data Science?
Задачи специалиста по данным:
- находит скрытые закономерности и связи во время изучения данных;
- анализирует данные по необходимому критерию, который покажет эффективность создаваемой модели;
- визуализирует данные;
- программирует и тренирует модель машинного обучения;
- оценивает с коллегами модель с точки зрения экономики;
- выявляет богатые источники данных, присоединяется к ним с другими потенциально неполными источниками данных и очищает полученный набор;
- анализирует риски;
- анализирует внутренние процессы;
- занимается внедрением моделей в существующие инфраструктуры;
- дорабатывает модель и следит за процессами;
- предлагает новые направления для развития бизнеса клиента;
- занимается разработкой отчетов и прогнозированием;
- консультирует руководителей и менеджера по продукту, основываясь на полученных данных.
Soft skills для Data Scientist
- Ассоциативное мышление.
- Способность излагать свои мысли так, чтобы их понял другой человек.
- Любопытство для погружения в проблему и дальнейшей работы с гипотезами.
- Умение находить эффективные решения проблем.
- Внимательность.
- Умение работать в команде и находить подход к каждому.
- Умение задавать хорошие вопросы.
- Дотошность.
- Умение визуализировать данные.
После курса вы сможете:
- работать с разными типами и структурами данных
- использовать библиотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, Sweetviz, Pandas Profiling, SciPy, Scikit-learn, CatBoost и XGBoost
- строить продвинутые и интерактивные визуализации
- проводить Exploratory Data Analysis и находить взаимосвязи в данных
- заполнять пробелы в данных
- валидировать гипотезы и анализировать результаты А/В-тестирования
- решать задачи прогнозирования и классификации
- строить простые ML-модели
- начать путь в Data Science.
Программа курса
- Введение в Data Science. Знакомство с задачами и инструментами
Разберитесь, какие задачи входят в область Data Science. Освойте инструменты для интерактивной работы с Python [IPython, Jupyter Notebook и Google Collaboratory]. Ознакомьтесь с библиотекой NumPy и разберитесь в ее преимуществах перед обычными списками. Научитесь создавать массивы и выполнять базовые операции над ними в NumPy. - Линейная алгебра и статистика
Возобновите знания по линейной алгебре и статистике. Научитесь вызывать векторное умножение, поэлементное сложение OR вычитание и другие функции в NumPy. Научитесь вводить и выводить матрицы и массивы разной величины, находить std и mean, выводить гистограмму одномерного массива. - Работа с табличными данными
Узнайте, какие задачи Data Science помогает решить библиотека Pandas. Научитесь создавать, импортировать и экспортировать табличные данные в Pandas Dataframe, манипулировать данными, обновлять их значения по индексу. Узнайте, что делать, чтобы не перегружать оперативку. - Matplotlib и Seaborn. Визуализация данных
Разберите базовые типы визуализации [line chart, scatter plot, bar plot, histogram]. Постройте базовые визуализации с помощью Python в Matplotlib и Seaborn. Узнайте о трех способах визуализации данных из Pandas в Dataframe. - Продвинутые и интерактивные визуализации
Разберитесь в типах продвинутых визуализаций [heatmap, box plot, pair plot, cumulative plot]. Постройте базовую интерактивную визуализацию в Plotly. Научитесь быстро и удобно анализировать отсутствующие значения в наборе данных с помощью визуализации. - Exploratory Data Analysis и очистка данных
Научитесь быстро понимать структуру набора данных любого размера и решать проблему наличия выбросов и дубликатов в наборе данных. Проведите Exploratory Data Analysis (EDA) с помощью Pandas, а затем ― с помощью библиотек Sweetviz и Pandas Profiling. - Поиск и устранение отсутствующих значений
Научитесь выявлять отсутствующие значения в наборе данных, отделять случайно отсутствующие значения от значений, отсутствующих ввиду системной ошибки. Обучитесь нескольким техникам заполнения отсутствующих значений. - Статистический анализ данных
Ознакомьтесь с библиотекой SciPy. Научитесь генерировать случайные величины разных вероятностных распределений, проводить тесты нормальности и сравнивать распределения двух случайных величин. Изучите основы проверки статистических гипотез. Проведите статистический тест в SciPy и проанализируйте результаты А/В-тестирования. - Задача прогнозирования. Линейная регрессия
Подготовьте данные для задачи линейной регрессии. Ознакомьтесь с моделью многомерной линейной регрессии и библиотекой Scikit-learn. Постройте многомерную линейную регрессию с помощью NumPy и с помощью Scikit-learn. Научитесь оценивать качества линейной регрессии с помощью метрик MSE, RMSE, MAE. - Задача прогнозирования. Другие виды регрессий
Ознакомьтесь с моделями полиномиальной регрессии, гребневой регрессии, регрессии по методу LASSO и регрессии «эластичная сеть». Научитесь улучшать качество линейной регрессии с помощью регуляризации. Узнайте, что делать в случае высокого bias OR высокого variance модели. - Задача классификации. Логистическая регрессия
Ознакомьтесь с задачей бинарной классификации и моделью логистической регрессии. Обучите модель логистической регрессии для классификации данных и оцените ее качество. Научитесь оценивать качество модели мультиклассовой классификации. - Деревья принятия решений
Изучите принцип работы модели «Деревья принятия решений». Определите отличия этой модели от остальных. Обучите модель «Деревья принятия решений» для решения задач регрессии и классификации. - Ансамбли моделей
Изучите базовые техники построения ансамблей. Научитесь строить и обучать разные типы ансамблей моделей. Определите, какой способ ансамблирования необходимо использовать в случае high bias, а какой ― в случае high variance. - Библиотеки CatBoost и XGBoost
Ознакомьтесь с библиотеками CatBoost и XGBoost. Узнайте, какие задачи они решают и чем отличаются друг от друга. Научитесь улучшать XGBoost-модель за счет оптимальных гиперпараметров модели. - Кластерный анализ данных
Узнайте, как обучить модель без учителя с помощью кластеризации. Изучите теорию и разберите на примерах, как работают методы кластеризации в моделях K-Means, DBSCAN и Agglomerative Clustering. Найдите группы похожих экземпляров в массиве данных с помощью кластеризации. - Отбор признаков и уменьшение соразмерности данных
Изучите простые способы выбора признаков. Выберите признаки так, чтобы оставить только самые значимые для модели. Научитесь применять методы уменьшения соразмерности данных для ML-модели [Singular Value Decomposition, Principal Component Analysis, Linear Discriminant Analysis].
Перейти к курсу ↑