Получить доступ
Эксклюзивный партнер
SkillFactory в Узбекистане
burger
Полный курс по Data Science c нуля
→ Работайте удаленно из любой точки мира
→ Специализируйтесь в узкой нише Data Science
→ Получите доступ ко всем льготам для айтишников

Data Scientist

Профессия

Освойте самую востребованную профессию в анализе данных
Длительность:
24 мес
Уровень:
с нуля
Старт:
каждый месяц
Это специалист, который обрабатывает большие объемы неструктурированной информации и превращает ее в упорядоченный набор данных.
Дата-сайентист может
Кто такой Data Scientist
Предсказать, окупится ли новый проект
Оценить будущий спрос на товары и услуги
Улучшить системы рекомендаций в соцсетях и сервисах
Создать приборы для автоматической постановки диагноза пациенту
Усовершенствовать транспортное движение
Построить систему распознавания лиц
Дата-сайентист использует методы науки о данных (Data Science), строит и тестирует математические модели. Он находит закономерности, дает прогнозы и предлагает лучшие решения в разных сферах.
Как Data Science применяется в жизни
Специалисты подразделения Google AI, занимающегося искусственным интеллектом, создали модель глубокого обучения (Deep Learning) для распознавания кожных болезней. DL-модель может диагностировать 26 болезней кожи с точностью 97%.
Компания Frontier Development Lab вместе со студентами из разных стран и специалистами Nvidia, разработала алгоритм, способный создать 3D-модель астероида за четыре дня. Этот метод используют сегодня для моделирования формы астероидов в реальном времени. А NASA применяет алгоритм NASA визуализации данных о космическом мусоре.
Компания Google создала приложение, которое позволяет слабовидящим и слепым узнавать об объектах рядом с ними — оно в реальном времени распознает на изображении с камеры объекты и передает информацию пользователю. Еще оно умеет зачитывать текст, знаки, штрих-коды и другие визуальные объекты.
Распознавание кожных заболеваний
Алгоритм моделирования астероидов
Распознавание объектов для слабовидящих и слепых
По данным Всемирного экономического форума, работа в Data Science занимает первое место в рейтинге профессий с самым большим спросом на рынке до 2025 года.

Количество вакансий в Data Science выросло на 433% за 3 года

Ритейл, киберспорт, путешествия, образование, медицина — грамотный Data Scientist нужен практически в любой индустрии, а спрос значительно превышает предложение.
03
04
7 из 10 работодателей нанимают людей с опытом

Вы получите реальный опыт

Это формат, где студенты решают реальные задачи бизнеса. У вас будет опыт, которого так не хватает выпускникам онлайн-школ. Вместе с ментором вы решите кейс для компании-партнера — и получите фидбэк от потенциального работодателя.
Реальный опыт даст студентам:
Реальные проекты в портфолио
Участие в стажировках и хакатонах
Шанс получить оффер от компании-заказчика
Опыт работы над проектом в команде
01
02
Поэтому мы придумали Фэктори

Модель распознавания жестов

Разработаете систему принятия решений, которая в режиме реального времени сможет реконструировать положение согнутых пальцев руки здорового пользователя. Преуспевшие студенты продолжат сотрудничество с компанией.
  • Python
  • Sklearn
  • Pandas
  • EDA
  • Keras
Супер Моторика

Анализ и сортировка данных

Вам предоставят изображения транспортных средств различных типов и с разных ракурсов. С помощью дескрипторов вы разобьете картинки на кластеры и интерпретируете каждый из них. В результате получите кейс в портфолио и обратную связь от эксперта из компании.
  • Pandas
  • ML
  • Numpy
Intellivision
Intellivision
Новичок
Программа расчитана на обучение науке о данных с нуля. Вы начнете с SQL и Python. Получите необходимую теорию по математике, статистике и теории вероятности и отработаете ее на практике. А через год легко сможете решать задачи.
Программист
Научитесь работать с моделями машинного обучения, анализировать данные на Python и прокачаете аналитическое мышление.

Вам подойдет этот курс, если вы

Аналитик
Начнете анализировать данные на продвинутом уровне, автоматизировать процесс сбора данных. Научитесь обучать модели и делать прогнозы, а также применять это для решения бизнес-задач.

Кем вы станете

После базового курса вы сможете выбрать более узкую специализацию в Data Science — ML Engineer, CV Engineer или NLP Engineer
— Разработаете модель предсказания кредитного рейтинга
— Решите задачу классификации спама СМС-сообщений
— Разработаете систему рекомендаций подходящих товаров при покупке
— Построите модель для увеличения продаж в розничном бизнесе
— Создадите изображения по текстовому описанию с помощью нейросети DALL-E
ML Engineer — Разработчик машинного обучения
— Научитесь решать все базовые задачи
в сфере Computer Vision
— Приобретёте знание реального флоу работы
с моделями CV, актуальных подходов и продвинутых инструментов, необходимых для создания CV-сервисов
— В итоговом проекте создадите виртуального коуча, способного оценивать правильность выполнения упражнений на видео
CV Engineer — Специалист
по компьютерному зрению

Эффективный формат онлайн-обучения

Занимайтесь в своем темпе
Наши курсы ориентированы на тех, кто работает и хочет сам регулировать нагрузку. Занимайтесь без отрыва от работы и выделяйте на учебу столько времени, сколько есть прямо сейчас (15 минут или 2 часа в день).
20% обучения — интересная и важная теория
Теория разбита на короткие блоки, после которых обязательно идет практика.

Вы смотрите короткие видео, изучаете текстовые материалы и приступаете к заданиям, чтобы закрепить знания.
80% обучения — практика в разных форматах
Для развития навыков у нас есть 5 видов практики: тренажеры, тесты, домашние задания, проекты и хакатоны. Разнообразие форматов помогает усваивать знания максимально эффективно.
Менторы и координаторы помогут дойти до конца
Все менторы — опытные практики из IT-индустрии. Они дают качественную обратную связь на задания, отвечают на вопросы и помогают студенту достичь своих целей во время обучения. Выпускники оценивают менторскую поддержку на 9,1 балла из 10.

Координаторы постоянно на связи, чтобы решить любой организационный вопрос. Их задача — мотивировать студентов и помочь пройти курс до конца.
Фокус на подготовке к трудоустройству
Вы тренируетесь на кейсах компаний, а также делаете проекты для реальных заказчиков в команде. Помогаем оформить резюме и подготовиться к собеседованиям.

Лучших студентов рекомендуем по накопленной базе работодателей. На стажировках в компаниях-партнерах вы отработаете навыки и пообщаетесь с потенциальными работодателями.
Не важно, сколько вам лет и какой у вас опыт, — вы справитесь.
Просто следуйте программе обучения.
БАЗА
На этом этапе вы изучите основы программирования на Python, научитесь предобрабатывать и анализировать данные, а также познакомитесь с основными задачами дата-сайентиста.

Программа курса
«Профессия Data Science»

Введение
1 неделя
Вы сможете сформулировать для себя реальные цели обучения, узнаете, в чем ценность DS для бизнеса, познакомитесь с основными задачами дата-сайентиста и разберетесь, как строится разработка любого DS-проекта.
• INTRO-1. Как учиться эффективно — онбординг в обучение
• INTRO-2. Обзор профессии. Типы задач в Data Science. Этапы и подходы к разработке Data Science проекта
Проектирование разработки
5 недель
Вы научитесь работать с основными типами данных с помощью языка Python и сможете применять в повседневной работе циклические конструкции, условные операторы и функции.
• PYTHON-1. Основы Python
• PYTHON-2. Погружение в типы данных
• PYTHON-3. Условные операторы
• PYTHON-4. Циклы
• PYTHON-5. Функции и функциональное программирование
• PYTHON-6. Практика
• PYTHON-7. Гид по стилю в среде Python (бонусный)
Работа с данными
8 недель
На этом этапе вы овладеете базовыми навыками работы с данными: научитесь подготавливать, очищать и преобразовывать данные так, чтобы они были пригодны для анализа. Кстати, об анализе: вы будете анализировать данные с помощью популярных библиотек Matplotlib, Seaborn, Plotly.
• PYTHON-8. Инструменты Data Science
• PYTHON-9. Библиотека NumPy
• PYTHON-10. Введение в Pandas
• PYTHON-11. Базовые приемы работы с данными в Pandas
• PYTHON-12. Продвинутые приемы работы с данными в Pandas
• PYTHON-13. Очистка данных
• PYTHON-14. Визуализация данных
• PYTHON-15. Принципы ООП в Python и отладка кода (дополнительный модуль)
• Проект 1. Аналитика датасета по закрытым вопросам
Подгрузка данных
6 недель
Вы сможете выгружать данные из разных форматов и источников. А поможет вам в этом SQL — язык структурированных запросов. Вы научитесь использовать агрегатные функции, соединения таблиц и сложные объединения.
• PYTHON-16. Как выгружать данные из файлов разных форматов
• PYTHON-17. Получение данных из веб-источников и API
• SQL-0. Привет, SQL!
• SQL-1. Основы SQL
• SQL-2. Агрегатные функции
• SQL-3. Соединение таблиц
• SQL-4. Сложные объединения
• Проект 2. Подгрузка новых данных. Уточнение анализа
Статистический анализ данных
7 недель
Разведывательный анализ данных (EDA) — вот, что окажется в центре вашего внимания. Вы познакомитесь со всеми этапами такого анализа и научитесь проводить его с помощью библиотек Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Кроме того, вам удастся поработать на Kaggle, популярном сервисе по участию в соревнованиях.
• EDA-1. Введение в разведывательный анализ данных. Алгоритмы и методы EDA
• EDA-2. Математическая статистика в контексте EDA. Типы признаков
• EDA-3. Проектирование признаков (Feature Engineering)
• EDA-4. Статистический анализ данных на Питоне
• EDA-5. Статистический анализ данных на Питоне. Часть 2
• EDA-6. Проектирование экспериментов
• EDA-7. Kaggle площадка
• Проект 2
Введение в машинное обучение
9 недель
Вы познакомитесь с ML-библиотеками для моделирования зависимостей в данных. Вы сможете обучить основные виды ML-моделей, провести валидацию, интерпретировать результаты работы и выбрать важные признаки (feature importance).
• ML-1. Теория машинного обучения
• ML-2. Обучение с учителем: Регрессия
• ML-3. Обучение с учителем: Классификация
• ML-4. Обучение без учителя: Кластеризация и техники понижение размерности
• ML-5. Валидация данных и оценка модели
• ML-6. Отбор и селекция признаков
• ML-7. Оптимизация гиперпараметров модели
• ML-8. ML Cookbook
• Проект 3. Задача классификации
ОСНОВНОЙ БЛОК
Линейная алгебра, математический анализ, дискретная математика — звучит страшно, но не пугайтесь: разберем все эти предметы и научим с ними работать! На втором этапе вы погрузитесь в математику и основы машинного обучения, узнаете больше о профессиях DS, а также благодаря профориентации выберите трек обучения второго года.
Математика и машинное обучение. Часть 1
6 недель
Вы сможете решать практические задачи с помощью ручного счета и Python (векторные и матричные вычисления, работа с множествами, исследование функций с помощью дифференциального анализа).
• MATH&ML-1. Линейная алгебра в контексте Линейных методов. Часть 1
• MATH&ML-2. Линейная алгебра в контексте Линейных методов. Часть 2
• MATH&ML-3. Математический анализ в контексте задачи оптимизации Часть 1
• MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть 2
• MATH&ML-5. Математический анализ в контексте задачи оптимизации. Часть 3
• Проект 4. Задача регрессии
Математика и машинное обучение. Часть 2
6 недель
Вы познакомитесь с основными понятиями теории вероятности и математической статистики, алгоритмами кластеризации, а также научитесь оценивать качество произведенной кластеризации и представлять результаты в графическом виде.
• MATH&ML-6. Теория вероятностей в контексте Наивного Байесовского классификатора
• MATH&ML-7. Алгоритмы на основе Деревьев решений
• MATH&ML-8. Бустинг & Стекинг
• MATH&ML-9. Кластеризация и техники понижение размерности. Часть 1
• MATH&ML-10. Кластеризация и техники понижение размерности. Часть 2
• Проект 5. Ансамблевые методы
ML в бизнесе
8 недель
Вы научитесь использовать ML-библиотеки для решения задачи временных рядов и рекомендательных систем. Вы сможете обучить ML-модель и провести её валидацию, а также создать работающий прототип и запустить модель в веб-интерфейсе. А ещё получите навыки A/B-тестирования, чтобы можно было оценить модель.
• MATH&ML-11. Временные ряды. Часть 1
• MATH&ML-12. Временные ряды. Часть 2
• MATH&ML-13. Рекомендательные системы. Часть 1
• MATH&ML-14. Рекомендательные системы. Часть 2
• PROD-1. Подготовка модели к Production
• PROD-2. ПрототипStreamlit+Heroku
• PROD-3. Бизнес понимание. Кейс
• Проект 6. Тема на выбор: Временные ряды или Рекомендательные системы
УРОВЕНЬ PRO
На третьем этапе вы познакомитесь с одним из методов машинного обучения — глубоким обучением (DL). А также вас ждет полноценный блок выбранной специализации: вы можете освоить навыки машинного обучения (ML), познакомиться с рутиной CV (компьютерного зрения) или прокачаться в NLP*, обработке естественного языка.
При выборе CV или ML вы сможете пройти курс по NLP без менторской поддержки бесплатно
Второй год обучения - 3 специализации на выбор
Профориентация
10 недель
ML, CV или NLP: на этом этапе вам наконец предстоит сделать выбор, по какому пути двигаться дальше. Мы расскажем о каждой специализации и предложим решить несколько практических задач, чтобы вам было проще определиться.
Трек ML - Engineer
29 недель
В ML-треке вы научитесь решать углубленные задачи машинного обучения, овладеете компетенциями дата-инженера, отточите навык работы с библиотеками Python. Также вы научитесь создавать MVP (минимально жизнеспособную версию продукта), узнаете все тонкости вывода ML-модели в продакшн и узнаете, как работают ML-инженеры в реальной жизни.
• Введение в Deep Learning
• Основы Data Engineering
• Дополнительные главы Python и ML
• Экономическая оценка эффектов и разработка MVP
• ML в Production
• Углубленное изучение ML-разработки и выпускной проект по выбранной теме
Трек CV - Engineer
29 недель
На CV-треке вы научитесь решать такие задачи компьютерного зрения, как классификация изображений, сегментация и детекция, генерация и стилизация картинок, восстановление и повышение качества фотографий. Кроме того, вы узнаете, как выкатывать нейронные сети в продакшн.
• Введение в Deep Learning
• Основы Data Engineering
• Дополнительные главы Python и ML
• Экономическая оценка эффектов и разработка MVP
• ML в Production
• Углубленное изучение ML-разработки и выпускной проект по выбранной теме
Deep Learning и нейронные сети
БОНУС
Где применяются нейросети? Как обучить нейронную сеть? Что такое Deep Learning? Ответы на эти вопросы вы узнаете в бонусном разделе DL.
Введение в Data Engineering
БОНУС
Вы узнаете, в чём различие ролей дата-сайентиста и дата-инженера, какими инструментами пользуется последний в своей работе, какие задачи ежедневно решает. Слова «снежинка», «звезда» и «озеро» обретут новые значения :)

Екатерина Тарасевич

Санкт-Петербург
Всем привет, меня зовут Екатерина. Мне 29 лет. И я живу в городе Санкт-Петербурге.

Александр Журавлев

Минск
Всех приветствую. Меня зовут Александр. Я живу в городе Минске. Больше 20 лет я работаю врачом.

Марина Чигарева

Москва
Здравствуйте. Я Марина. Живу в Москве. Работаю главным бухгалтером.

Дмитрий Анпилогов

Саратов
Всем привет. Я Дмитрий из города Саратова. Уже 25 лет директор турагентства.

Валентин Шунайлов

Челябинск
Добрый день. Меня зовут Валентин. Я из города Челябинска.

Долговская Виктория

Каменск-Уральский
Добрый день, меня зовут Виктория. В настоящий момент я проживаю в городе Каменск-Уральский.

Антон Пальшин

Калининград
Всем привет. Меня зовут Антон. Живу в Калининграде. Работаю комплектовщиком.

Николай Шумаков

Москва
Привет. Меня зовут Николай, и я являюсь студентом Skillfactory по программе фронтенд-разработчик.
53 года, Москва
Привет. Меня зовут Алексей Журавлев. Я генеральный директор агентства Универсальный менеджмент.

Татьяна Мирко

30 лет, Москва
Добрый день. Я маркетолог. Учусь в Skillfactory по специальности фронтенд-разработчик.

Ника Гвенетадзе

Москва
Привет, меня зовут Ника. Живу я в Москве, а работаю руководителем производства.

Андрей Шевченко

34 года, Рига
Всем привет. Меня зовут Андрей. Живу в Риге. Работаю специалистом по кибербезопасности.

Ольга Шутылева

Харьков
Привет. Меня зовут Ольга. Живу в Харькове. Работаю на госслужбе.

Аркадий Хазанов

Набережные Челны
Привет. Меня зовут Аркадий. Я бариста.

Сергей Димов

34 года, Абакан
Привет. Меня зовут Сергей. Я учусь в Skillfactory на курсе full-stack разработчик на JavaScript вот уже 2 месяца.

Артем Белоконский

Киев
Добрый день. Меня зовут Артем Белоконский. Я из Украины, из Киева.

Валентин Ветюков

Всем привет. Меня зовут Валентин. Живу и работаю в Москве.

Александра Быстрова

Москва
Привет. До начала обучения в Skillfactory я работала в сфере коммуникаций и клиентского сервиса.
27 лет, Москва

Александра Олейник

Всем привет. Я Саша. Я прохожу курс «Профессия Data Science».

Преподаватели и авторы курса

Автор раздела курса
Эксперт по Data Science
Компетенции: DS(ML), DE, Big Data
Юлия Мочалова
Ведущий автор раздела MATH&ML
Эксперт по Data Science
Компетенции: Python, машинное обучение, cтатистика, анализ данных
Маргарита Бурова