logo
Ещё

Data Scientist – обзор профессии

Аналитики данных становятся всё популярнее и требуются в различных сферах. Для крупных компаний этот специалист на вес золота, поскольку его грамотная работа может увеличить объём продаж в несколько раз. В статье подробно ответим на вопрос, что за профессия data science, расскажем о задачах, с которыми сталкивается специалист. Поговорим о месте работы дата сайентиста, его рабочем дне, плюсах и минусах профессии. Вы узнаете, что нужно для старта в этой сфере, какие перспективы развития, и что ждёт рынок дата сайенс в ближайшем будущем.


Что такое Data Science

Data Science – использование научных методов во время работы с данными. Это междисциплинарная область, основанная на статистике, математике, системном анализе, машинном обучении. Она исследует и анализирует сверхбольшие объёмы информации для получения практического результата. 

Data Science помогает автоматизировать размещение контента, прогнозировать заболевания, предлагать рекомендации пользователям, планировать производство, искать подходящие товары или услуги.


Используется в самых разных сферах экономики – от здравоохранения и спорта до государственного управления и онлайн-продаж. 


Кто такой Data Scientist

Дата сайнтист – специалист, который обрабатывает массивы данных, используя алгоритмы машинного обучения. Он строит и тестирует математические модели поведения данных. Благодаря этому в них находят закономерности или прогнозируют будущие значения. 

Например, ориентируясь на данных о продажах билетов на отдых в Сочи прошлого года, он может сделать прогноз на востребованность этого направления отдыха в следующем году. Специалисты строят модели при помощи алгоритмов машинного обучения, работают с базами данных. 

Задачи специалиста

В каждой компании задачи дата сайентиста отличаются. В крупных корпорациях на плечах специалиста может висеть несколько проектов. Среди основных задач, которые решают большинство аналитиков:

  • выяснить требования заказчика;
  • подготовить данные для обработки;
  • оценить эффективность модели;
  • разработать и потренировать модель машинного обучения;
  • оценить экономический эффект от внедрения модели;
  • внедрить её в производственный процесс или продукт;
  • сопровождать модель. 

Где работают дата-сайентисты

Data scientists работают в сферах бизнеса, где для достижения применяются методы машинного обучения. Сциентист может работать в:

  • банках;
  • транспортных компаниях над созданием алгоритмов вычислениях оптимальных маршрутов;
  • производстве над прогнозом сбоев оборудования, дефектов продукции;
  • продажах над анализом данных предыдущих лет и созданием алгоритмов, которые спрогнозируют спрос на услуги фирмы в будущем;
  • IT-сфере над созданием ботов, алгоритмов поиска, нейросетей;
  • медицине над автоматической постановкой диагнозов;
  • сельском хозяйстве над прогнозом урожайности;
  • страховой сфере над оценкой вероятности наступления страхового случая;
  • биоинформатике над созданием генетических карт;
  • стартапах над разработкой технологий, которые выведут продукт на новый уровень.

Как выглядит рабочий день специалиста

Специалист может работать в офисе, из дома или совмещать оба рабочих места. Если проект большой, либо у аналитика данных нет опыта, то он будет работать в команде сообща. Специалист с большим опытом может общаться напрямую с заказчиками и делегировать задачи своей команде.

В большинстве случаев день начинается с проверки рабочей почты и общения с командой, определения цели на день. Потом наступает стандартная рутинная забота. Специалист анализирует, предобрабатывает и очищает данные. Занимается разработкой и тестированием моделей, формулировкой и проверкой гипотез, визуализацией данных и написанием технической документации. Функция этих задач – найти оптимальное решение проблемы, которую поставил заказчик. Исходя из этого применяются различные пути достижения цели – где-то нужно прибегнуть к математическому анализу, где-то придётся окунуться в статистику. 

Среди самого приятного в рабочем дне специалисты называют поиск решения для сложной задачи. Меньше всего дата сайентисты любят писать сопроводительную документацию, которая может занимать несколько сотен страниц. 

В дни, когда нет рабочих проектов, специалисты могут заниматься самообучением, помогать коллегам или готовить презентации для заказчиков. Во время работы аналитикам приходится общаться с разными людьми, среди которых большая часть не разбирается в инструментах обработки, не знакома с моделями машинного обучения и другими техническими тонкостями. 

Что нужно для старта в профессии

Для старта в профессии дата сайнс не достаточно одних лишь навыков программирования. Аналитику данных нужно иметь личностные качества, которые помогут ему развиваться по карьерной лестнице. От сайентиста понадобится большое терпение и усидчивость, поскольку не всегда можно решить имеющуюся задачу с первого раза. Важно обладать логическим мышлением и техническим складом ума. Такая работа потребует от специалиста самоорганизованности и саморазвития. Также аналитику важно обладать критическим мышлением, которое поможет найти выход из ситуации, рассмотреть все стороны проблемы. Специалист должен выявлять главное в задаче. 

Необходимые качества

Чтобы работать аналитиком данных, следует обладать следующими знаниями:

  • Понимание математического анализа – теории вероятности, статистики, линейной алгебры. Это поможет разобраться в значимости данных, разработать новые решения, оптимизировать и скорректировать существующие аналитические модели.
  • Программирование. Специалист в своей работе собирает, очищает, обрабатывает и систематизирует данные. Для этого аналитики используют Python. 
  • Работа с языком запросов SQL. Базы данных – одни из важнейших инструментов аналитика. 
  • Алгоритмы обработки. Человек должен понимать основы линейной и логистической регрессии, дерева принятия решений и метода опорных векторов. 
  • Умение донести свою идею. В большинстве случаев заказчики проекта не смогут понять технический язык, поэтому аналитику данных нужно уметь подавать информацию простым и понятным языком.
  • Работать сообща. Многими проектами занимаются специалисты в команде. Data scientist должен чётко понимать свою роль, уметь общаться с партнёрами, доносить до них информацию и слушать их мнение. 
  • Умение видеть экономически выгодные решения. В большинстве случаев к помощи специалистов прибегает бизнес, который хочет повысить узнаваемость, продажи товаров или услуг с минимальными затратами. Аналитик должен понимать, как реализовывать бизнес-идеи при помощи обработки данных. 

Курсы по Data Science 

В интернете много онлайн курсов, которые помогут приобрести необходимые навыки для входа в профессию. Рассмотрим топ-3 платных и бесплатных. 

Платные

Курс «Data Scientist с нуля до Junior» от Skillbox

Школа

Skillbox

Стоимость

96 439 руб

Цена в рассрочку

4 384 руб/мес

Длительность курса

9 месяцев

Программа трудоустройства

Есть

Формат

Запись лекций, Онлайн занятия с преподавателем

Курс «Data Scientist» от Skillfactory

Школа

Skillfactory

Стоимость

179 682 руб

Цена в рассрочку

5 546 руб/мес

Длительность курса

24 месяца

Программа трудоустройства

Есть

Формат

Запись лекций, Онлайн занятия с преподавателем

Курс «Data Scientist (Расширенная траектория)» от Нетология

Школа

Нетология

Стоимость

177 700 руб

Цена в рассрочку

5 194 руб/мес

Длительность курса

24 месяца

Программа трудоустройства

Есть

Формат

Запись лекций, Онлайн занятия с преподавателем

Бесплатные

Введение в Data Science и машинное обучение от Института биоинформатики. Студенты освоят понятия Data Science и Machine Learning, популярные библиотеки для анализа данных. Программа обучения состоит из 30 уроков.

Плюсы:

  • наличие сертификата;
  • тесты и интерактивные задачи;
  • современная программа.

Минусы:

  • нет обратной связи.

Data Science: будущее для каждого от Нетологии. Расскажут о направлениях и профессии в этой сфере, базовых навыках, поиске работы. Студенты напишут код с помощью SQL.

Плюсы:

  • видео и текстовые материалы;
  • практические задания;
  • доступ к закрытому чату. 

Минусы:

  • нет обратной связи.


Машинное обучение от ОмГТУ. Учебная программа включает в себя 71 урок, текстовые материалы и тесты. Студенты научатся работать с таблицами данных, строить модели машинного обучения, восстанавливать данные с помощью искусственного интеллекта.

Плюсы:

  • можно учиться сразу после регистрации;
  • материал подаётся простым языком.

Минусы:

  • нет практики;
  • для прохождения нужно уверенное знание математики.

Обзор рынка: востребованность и заработная плата

На рынке труда наблюдается высокая востребованность дата саентистов. Количество вакансий значительно превышает количество специалистов. Компании активно борются за аналитиков данных, что выражается в высокой заработной плате: Junior может получать свыше 70 000 руб., Middle в районе 100 000 руб., Senior – 150 000 – 200 000 руб., зарплата Lead свыше 200 000 руб.

Спрос на специалистов ежегодно растёт в два раза. Компании чаще всего ищут Middle и Senior. В настоящее время около 2 000 вакансий только в Москве. В Санкт-Петербурге их в районе 300. Это два города, где аналитик может быстро подняться по карьерной лестнице. 

Компании всё чаще предлагают работу в формате полной или частичной удалёнки. В большинстве предложений требования к кандидату: знание языка программирования Python, SQL, Git. 

Вероятный карьерный путь

Карьера в Data Science мало чем отличается от карьеры в других направлениях IT-отрасли:

  • Специалист уровня Джуниор занимается решением детализированных задач. Он ещё не разбирается в тонкостях, ему нужно подсказывать и направлять на правильный путь. Зачастую такие специалисты занимаются подготовкой данных к обработке, ищут в них ошибки, строят сводные таблицы.
  • Специалисты уровня Мидл, которые больше разбираются в технологиях big data, могут самостоятельно выполнять стандартные задачи. Помощь такому сайентисту потребуется только в нестандартных ситуациях, которые бывают не так часто. Основная работа – машинное обучение и создание алгоритмов. 
  • Синьоры, обладающие большим набором практических навыков, могут одновременно работать над несколькими проектами. Специалисты получают задание от бизнеса и самостоятельно работают над ней. Они обрабатывают большие объёмы данных, визуализируют результаты, работают со сложными фреймворками и помогают программистам младших уровней.

Специалистам без опыта работы или с минимальными знаниями лучше всего устроиться в компанию, где будут опытные наставники, которые подскажут и обучат тонкостям профессии. Желательно получить базовые знания во всех сферах дата сайенс, чтобы стать более универсальным и востребованным мастером. 

Программисты уровня Middle и Senior могут перейти на удалённый формат работы и заниматься проектами самостоятельно. Это может быть фриланс или собственный небольшой бизнес. 

Плюсы и минусы профессии

У профессии data analyst существуют свои плюсы:

  • востребованность, на рынке IT-сферы большой дефицит data engineer;
  • лёгкая обучаемость – благодаря разнообразным курсам и другим возможностям можно с нуля быстро овладеть технологиями машинного обучения;
  • зарплата специалистов выше, чем в большинстве других направлений IT;
  • быстрый карьерный рост;
  • если освоить ряд смежных профессий, то получится быстро повысить свой уровень;
  • можно работать в зарубежных компаниях из дома и получать в несколько раз больше, чем в России.

Профессия специалиста, который занимается машинным обучением, имеет ряд минусов:

  • чтобы освоить алгоритмы машинного обучения, нужно обладать техническим складом ума и понимать основы математики;
  • в профессии важны усидчивость и терпение, потому что результат достигается путём множества проб;
  • важно следить за трендами, чтобы оставаться востребованным.

FAQ 

Есть ли перспективы в профессии, если получить уровень Джуниор после 30 лет?

С Джуниор до Миддл можно развиться за несколько лет постоянной работы и самообучения. Для уровня Синьор понадобится около 7 – 10 лет. Главное – настрой и готовность изменить наработанные в другой профессии принципы, поскольку в дата сайенс они могут помешать.

Чем Data Scientist отличается от Data Engineer?

Последние работают с интеграцией, моделированием, оптимизацией данных. Они больше занимаются разработкой, тестированием и поддержкой инфраструктуры данных. Для них важно обслужить алгоритм данных, а для аналитиков – проверить гипотезы и написать эти самые алгоритмы. Для достижения качественного результата оба специалиста должны работать сообща.

Сильно ли нужен английский язык?

Много технической литературы на английском языке, различные фреймворки и технологии имеют англоязычный интерфейс. Зная язык, можно общаться с зарубежными заказчиками, читать иностранную литературу, просматривать форумы с полезной информацией. 

Подведём итоги 

Кратко о профессии:

  • Data Science – раздел информатики, который изучает проблемы анализа, обработки и представления данных;
  • дата сайнтист – специалист, который обрабатывает массивы данных с помощью алгоритмов машинного обучения;
  • среди основных задач специалиста – поиск скрытых закономерностей, анализ и визуализация данных, программирование и тренировка модели машинного обучения, внедрение их в существующую инфраструктуру;
  • специалисты работают в разных сферах экономики: банки, логистика, IT, здравоохранение, сельское хозяйство, страхование;
  • для старта в профессии нужно знать python, английский язык, математику, статистику и теорию вероятности, алгоритмы обработки, язык запросов;
  • специалист уровня Джуниор может получать 60 000 – 80 000 руб. и за несколько лет работы дорасти до Миддл или Синьор с зарплатой от 200 000 руб. в месяц;
  • среди основных плюсов профессии – высокая зарплата, низкая конкуренция, быстрый карьерный рост и лёгкая обучаемость, среди минусов – технический склад ума, наличие стрессоустойчивости, усидчивости и терпения.
Часто ищут