- Вместе с Еленой Герасимовой, руководителем факультета «Аналитика и Data Science» в Нетологии, продолжаем разбираться, как взаимодействуют между собой и чем различаются Data Scientist и Data Engineer.
- В первой части рассказали об основных отличиях Data Scientist и Data Engineer.
- В этом материале поговорим о том, какими знаниями и навыками должны обладать специалисты, какое образование ценится работодателями, как проходят собеседования, а также сколько зарабатывают дата-инженеры и дата-сайентисты.
Профильное образование для обоих специалистов — Computer Science.
Любой специалист по данным — дата-сайентист или аналитик — должен уметь доказывать корректность своих выводов. Для этого не обойтись без знания статистики и связанной со статистикой базовой математики.
Машинное обучение и инструменты анализа данных незаменимы в современном мире. Если привычные инструменты недоступны, нужно иметь навыки быстрого изучения новых инструментов, создания простых скриптов для автоматизации задач.
Важно отметить, что специалист по работе с данными должен эффективно донести результаты анализа. В этом ему поможет визуализация данных или результатов проведённых исследований и проверки гипотез. Специалисты должны уметь создавать диаграммы и графики, использовать инструменты визуализации, понимать и разъяснять данные из дашбордов.
Для инженера данных на первый план выходят три направления.
Алгоритмы и структуры данных. Важно набить руку в написании кода и использовании основных структур и алгоритмов:
- анализ сложности алгоритмов,
- умение писать понятный поддерживаемый код,
- пакетная обработка,
- обработка в реальном времени.
Базы и хранилища данных, Business Intelligence:
- хранение и обработка данных,
- проектирование целостных систем,
- распределенные файловые системы.
Hadoop и Big Data. Данных становится всё больше, и на горизонте 3‒5 лет эти технологии станут необходимы каждому инженеру. Плюс:
- Data Lakes,
- работа с облачными провайдерами.
Машинное обучение будет использоваться повсеместно, и важно понимать, какие бизнес-задачи оно поможет решить. Не обязательно уметь делать модели (с этим справятся дата-сайентисты), но нужно разбираться в их применении и соответствующим требованиям.
- Освоите профессию с высоким окладом на низкоконкурентном рынке
- Научитесь автоматизировать работу с данными, настраивать мониторинги, создавать конвейеры обработки и схемы хранения данных
- Получите знания, равноценные опыту 2‒3 лет самостоятельного изучения инжиниринга данных
В международной практике начальная зарплата обычно составляет $100 000 в год и значительно увеличивается с опытом, по данным Glassdoor. Кроме того, компании часто предоставляют опционы на акции и 5‒15% годовых бонусов.
В России в начале карьеры зарплата обычно не меньше 50 тыс. рублей в регионах и 80 тыс. в Москве. На этом этапе не требуется опыт, кроме пройденного обучения.
Через 1‒2 года работы — вилка 90‒100 тыс. рублей.
Вилка увеличивается до 120‒160 тыс. через 2‒5 лет. Добавляются такие факторы, как специализация прошлых компаний, размер проектов, работа с big data и прочее.
После 5 лет работы легче искать вакансии в смежных отделах или откликаться на такие узкоспециализированные позиции, как:
- Архитектор или ведущий разработчик в банке или телеком — около 250 тыс.
- Pre-Sales у вендора, с технологиями которого вы работали плотнее всего, — 200 тыс. плюс возможен бонус (1‒1,5 млн рублей).
- Эксперты по внедрению Enterprise business application, таких как SAP, — до 350 тыс. рублей.
Исследование рынка аналитиков компании «Нормальные исследования» и рекрутингового агентства New.HR показывает, что специалисты по Data Science получают в среднем большую зарплату, чем аналитики других специальностей.
В России начальная зарплата дата-сайентиста с опытом работы до года — от 113 тыс. рублей.
В качестве опыта работы сейчас также учитывается прохождение обучающих программ.
Через 1‒2 года такой специалист уже может получать до 160 тыс. рублей.
Для сотрудника с опытом работы от 4‒5 лет вилка вырастает до 310 тыс.
На западе выпускники программ профессионального обучения проходят первое собеседование в среднем через 5 недель после окончания обучения. Около 85% находят работу через 3 месяца.
Процесс прохождения собеседований на вакансии инженера данных и дата-сайентиста практически не различается. Обычно состоит из пяти этапов.
Кандидатам с непрофильным предыдущим опытом (например, из маркетинга) необходимо для каждой компании подготовить подробное сопроводительное письмо или иметь рекомендации от представителя этой компании.
Проходит, как правило, по телефону. Состоит из одного‒двух сложных и столько же простых вопросов, касающихся текущего стека работодателя.
Может проходить по телефону. На этом этапе кандидата проверяют на общую адекватность и способность общаться.
Чаще всего проходит очно. В разных компаниях уровень позиций в штатном расписании отличается, и называться позиции могут по-разному. Поэтому на этом этапе проверяют именно технические знания.
Data Scientist и Data Engineer — стратегические позиции, а для многих компаний к тому же новые. Важно, чтобы потенциальный коллега понравился руководителю и совпадал с ним во взглядах.
ЧИТАТЬ ТАКЖЕ
Кто такой Data Engineer и как им стать
- Научитесь строить и обучать предиктивные модели с помощью алгоритмов машинного обучения и нейросетей
- Сможете находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы
Появилось достаточно много новых инструментов по работе с данными. И мало кто одинаково хорошо разбирается во всех.
Многие компании не готовы нанимать сотрудников без опыта работы. Однако кандидаты с минимальной базой и знанием основ популярных инструментов могут получить нужный опыт, если будут обучаться и развиваться самостоятельно.
Желание и умение учиться. Необязательно сразу гнаться за опытом или менять работу ради нового инструмента, но нужно быть готовым переключиться на новую область.
Стремление к автоматизации рутинных процессов. Это важно не только для продуктивности, но и для поддержания высокого качества данных и скорости их доставки до потребителя.
Внимательность и понимание «что там под капотом» у процессов. Быстрее решит задачу тот специалист, у которого есть насмотренность и доскональное знание процессов.
Кроме отличного знания алгоритмов, структур данных и пайплайнов, нужно научиться мыслить продуктами — видеть архитектуру и бизнес-решение как единую картину.
Например, полезно взять любой известный сервис и придумать для него базу данных. Затем подумать, как разработать ETL и DW, которые наполнят её данными, какие будут потребители и что им важно знать о данных, а также как покупатели взаимодействуют с приложениями: для поиска работы и знакомств, прокат автомобилей, приложение для подкастов, образовательная платформа.
Позиции аналитика, Data Scientist и Data Engineer очень близки, поэтому переходить из одного направления в другое можно быстрее, чем из других сфер.
В любом случае, обладателям любого ИТ-бэкграунда будет проще, чем тем, у кого его нет. В среднем взрослые мотивированные люди переучиваются и меняют работу каждые 1,5‒2 года. Легче это даётся тем, кто учится в группе и с наставником, — по сравнению с теми, кто опирается лишь на открытые источники.
Материал изначально опубликован на habr.
- Научитесь с нуля собирать, анализировать и презентовать данные
- Освоите актуальные инструменты анализа данных: Hadoop и NoSQL
- Сможете находить инсайты в данных и предлагать бизнесу оптимальные сценарии роста
Data Scientist (Специалист по обработке, анализу и хранению больших массивов данных)
Обновлено
12 октября 2021
Data Scientist — специалист по обработке, анализу и хранению больших массивов данных, так называемых «Big Data». Кстати, в 2021 году центр профориентации ПрофГид разработал точный тест на профориентацию. Он сам расскажет вам, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте.
Вы даже не подозреваете, какая мощь скрывается внутри вас. Всё, что вам нужно сделать — это узнать, в чём ваша сила и как её применить. Тест «Талантум» основан на практиках, применяемых успешными людьми.
Data Science – наука о данных на стыке разных дисциплин: математика и статистика; информатика и компьютерные науки; бизнес и экономика.
(С.Мальцева, В.Корнилов НИУ «ВШЭ»)
Профессия новая, актуальная и чрезвычайно перспективная. Сам термин «Big Data» появился в 2008 году. А профессия Data Scientist — «Учёный по данным» официально зарегистрирована как академическая и межотраслевая дисциплина в начале 2010 г. Хотя первое упоминание термина «data science” было отмечено в книге Петера Наура 1974 г., но в ином контексте.
Необходимость возникновения такой профессии была продиктована тем, что когда речь идет об Ультра Больших Данных, массивы данных оказываются слишком велики для того, чтобы обрабатывать их стандартными средствами математической статистики. Каждый день через сервера компаний всего мира проходит тысячи петабайт ( 1015 байт =1024 терабайт) информации. Кроме таких объёмов данных, проблему усложняет их разнородность и высокая скорость обновления.
- Массивы данных подразделяют на 3 вида:
- структурированные (например, данные кассовых аппаратов в торговле);
- полуструктурированные (сообщения E-mail);
- неструктурированные (видеофайлы, изображения, фотографии).
- Большинство данных Big Data является неструктурированными, что значительно усложняет их обработку.
По отдельности специалист по статистике, системный аналитик или бизнес-аналитик не может решить задачи с такими объёмами данных. Для этого нужен человек с междисциплинарным образованием, компетентный в математике и статистике, экономике и бизнесе, информатике и компьютерных технологиях.
Главная задача Data Scientist — умение извлекать необходимую информацию из самых разнообразных источников, используя информационные потоки в режиме реального времени; устанавливать скрытые закономерности в массивах данных и статистически анализировать их для принятия грамотных бизнес-решений. Рабочим местом такого специалиста является не 1 компьютер и даже не 1 сервер, а кластер серверов.
Особенности профессии
В работе с данными Data Scientist использует различные способы:
- статистические методы;
- моделирование баз данных;
- методы интеллектуального анализа;
- приложения искусственного интеллекта для работы с данными;
- методы проектирования и разработки баз данных.
Должностные обязанности data scientist зависят от сферы его деятельности, но общий перечень функций выглядит следующим образом:
- сбор данных из разных источников для последующей оперативной обработки;
- анализ поведения потребителей;
- моделирование клиентской базы и персонализация продуктов;
- анализ эффективности внутренних процессов базы;
- анализ различных рисков;
- выявление возможного мошенничества по изучению сомнительных операций;
- составление периодических отчетов с прогнозами и презентацией данных.
Data Scientist, как настоящий учёный, занимается не только сбором и анализом данных, но и изучает их в разных контекстах и под разными углами, подвергая сомнению любые предположения.
Важнейшее качество специалиста по данным – это умение видеть логические связи в системе собранной информации, и на основе количественного анализа разрабатывать эффективные бизнес-решения.
В современном конкурентном и быстро меняющемся мире, в постоянно растущем потоке информации Data Scientist незаменим для руководства в плане принятия правильных бизнес-решений.
Плюсы и минусы профессии
Плюсы
- Профессия не только чрезвычайно востребованная, но существует острый дефицит специалистов такого уровня. Поэтому так стремительно и широко финансируются и развиваются факультеты при самых престижных вузах по подготовке специалистов по данным. В России также растет спрос на Data Scientist.
- Высокооплачиваемая профессия.
- Необходимость постоянно развиваться, идти в ногу с развитием IT-технологий, самому создавать новые методы обработки, анализа и хранения данных.
Минусы
- Не каждый человек сможет освоить эту профессию, нужен особый склад ума.
- В процессе работы могут не сработать известные методы и более 60% идей. Множество решений окажется несостоятельным и нужно иметь большое терпение, чтобы получить удовлетворительные результаты. Учёный не имеет права сказать: «НЕТ!» проблеме. Он должен найти способ, который поможет решить поставленную задачу.
Место работы
Data Scientist занимают ключевые позиции в:
- технологических отраслях (системы автонавигации, производство лекарств и т.д.);
- IT-сфере (оптимизация поисковой выдачи, фильтр спама, систематизация новостей, автоматические переводы текстов и многое другое);
- медицине (автоматическая диагностика болезней);
- финансовых структурах (принятие решений о выдаче кредитов) и т.д;
- телекомпаниях;
- крупных торговых сетях;
- избирательных кампаниях.
Важные качества
- аналитический склад ума;
- трудолюбие;
- настойчивость;
- скрупулёзность, точность, внимательность;
- способность доводить исследования до конца, несмотря на неудачные промежуточные результаты;
- коммуникабельность;
- умение объяснить сложные вещи простыми словами;
- бизнес-интуиция.
Профессиональные знания и навыки:
- знание математики, матанализа, математической статистики, теории вероятностей;
- знание английского языка;
- владение основными языками программирования, у которых имеются компоненты для работы с большими массивами данных: Java (Hadoop), C++(BigARTM, Vowpel Wabbit, XGBoost), Python (Matplotlib, Numpy, Scikit, Skipy);
- владение статистическими инструментами — SPSS, R, MATLAB, SAS Data Miner, Tableau;
- основательное знание отрасли, в которой работает data scientist; если это фармацевтическая отрасль, то необходимо знание основных процессов производства, компонентов лекарств;
- главный базовый навык специалиста по data scientist – организация и администрация кластерных систем хранения больших массивов данных;
- знание законов развития бизнеса;
- экономические знания.
Как и в любой профессии здесь важно самообразование, несомненную пользу которому принесут такие ресурсы, как:
- онлайн-курсы ведущих университетов мира COURSERA;
- канал машинного обучения MASHIN LEARNING;
- подборка курсов edX;
- курсы Udacity;
- курсы Dataquest, на которых можно стать настоящим профи в Data Science;
- 6-шаговые курсы Datacamp;
- обучающие видео O’Reilly;
- скринкасты для начинающих и продвинутых Data Origami;
- ежеквартальная конференция специалистов Moskow Data Scients Meetup;
- соревнования по анализу данных Kaggle.сom
Оплата труда
Профессия Data Scientist является одной из самых высокооплачиваемых. Информация с сайта hh.ru — зарплата в месяц составляет от $8,5 тыс. до $9 тыс. В США оплата труда такого специалиста составляет $110 тыс. – $140 тыс. в год.
По результатам опроса исследовательского центра Superjob зарплата специалистов Data Scientist зависит от опыта работы, объёма обязанностей и региона. Начинающий специалист может рассчитывать на 70 тыс. руб. в Москве и 57 тыс. руб.
в Санкт-Петербурге. С опытом работы до 3 лет зарплата повышается до 110 тыс. руб. в Москве и 90 тыс. руб. в Санкт-Петербурге. У опытных специалистов с научными публикациями зарплата может достигать 220 тыс. руб. в Москве и 180 тыс. руб.
в Петербурге.
Ступеньки карьеры и перспективы
Профессия Data Scientist сама по себе является высоким достижением, для которой требуются серьёзные теоретические знания и практический опыт нескольких профессий. В любой организации такой специалист является ключевой фигурой. Чтобы достичь этой высоты надо упорно и целенаправленно работать и постоянно совершенствоваться во всех сферах, составляющих основу профессии.
Интересные факты о профессии
Про Data Scientist шутят: это универсал, который программирует лучше любого специалиста по статистике, и знает статистику лучше любого программиста. А в бизнес-процессах разбирается лучше руководителя компании.
ЧТО ТАКОЕ «BIG DATA» в реальных цифрах?
- Через каждые 2 дня объём данных увеличивается на такое количество информации, которое было создано человечеством от Рождества Христова до 2003 г.
- 90% всех существующих на сегодня данных появились за последние 2 года.
- До 2020 г. объём информации увеличится от 3,2 до 40 зеттабайт. 1 зеттабайт = 10 21 байт.
Кто такие data scientists и за что им платят 300 000 рублей в месяц – Лайфхакер
Главная задача этого специалиста — сделать полезные практические выводы, располагая только набором данных и умея их анализировать.
Data scientist работает с большими данными — огромными массивами информации, которые получают из самых разных источников. Например:
- в промышленности — с датчиков внутри механизмов: они измеряют температуру, давление, скорость производства продукции;
- в интернете — по поведению пользователей: сколько человек посетили определённую страницу, сколько времени они здесь провели, на какие кнопки нажимали, по каким объявлениям переходили.
Располагая всеми эти данными, data scientist знает, как выстроить прогноз, и поможет принять верное решение: продавать акции или нет, запускать ли рекламу и если да, то какую, и так далее.
Именно он способен оценить, насколько эффективно работает компания, что ей нужно улучшить, в каких направлениях выгоднее всего развиваться.
Он подводит чёткую математическую основу под любое решение, проверяет гипотезы, подкрепляет выводы данными и находит связь между, казалось бы, совсем не связанными между собой событиями.
Кто и как приходит в эту сферу
Mark Nazh / Shutterstock
Аналитика больших данных достаточно молодая область. Первыми сюда пришли разработчики, которые запускали проекты в самых разных направлениях: от интернет‑маркетинга и промышленности до банков и финансовых систем.
Вместе с разработчиками пришли и представители бизнеса: аналитики, маркетологи, финансисты. А математики и статистики разработали эффективные алгоритмы анализа данных, которые реально запустить на не слишком мощных ПК.
Но с появлением простых инструментов для сбора и анализа больших данных, а также с ростом вычислительных мощностей дорога в data science открылась всем.
Сегодня стать аналитиком больших данных с нуля, без технического бэкграунда, вполне реально. В курсе от Skillbox вы получите все необходимые знания и сможете применять их на практике.
Понадобится полтора года — не так уж и много для овладения новой профессией.
А если у вас уже есть даже небольшой опыт в IT, будет ещё проще.
На этом курсе вы улучшите навыки разработки на Python и R, освежите знания математики и статистики, прокачаете аналитическое мышление и научитесь решать реальные бизнес‑задачи с помощью ИИ и машинного обучения. Что особенно важно, в вашем портфолио появятся мощные проекты, которые помогут вам сменить направление и повысить доход.
Начинающим аналитикам курс Skillbox обеспечит прокачку технических скиллов. Вы научитесь ставить гипотезы и переводить их в эффективный код, обрабатывать массивы сырых данных, обучать машины и прогнозировать результаты. Это даст мощный толчок вашему карьерному росту.
Попробуйте свои силы
Сколько зарабатывает специалист по анализу данных
Сейчас передовые компании собирают big data, зная, что любые траты на её анализ и на зарплату соответствующих специалистов оправданы. Ведь это поможет быстро найти и устранить проблемы, улучшить качество обслуживания, запустить новые перспективные проекты.
Поскольку это новая сфера, специалисты по data science — на вес золота.
По итогам масштабного исследования зарплат аналитиков различных направлений в Москве оказалось, что самые высокие доходы, даже в начале карьерного пути, — именно у специалистов по data science.
Даже при соответствующем опыте работы меньше года они в среднем зарабатывали не меньше 100 тысяч рублей. А при стаже от 3 до 6 лет в этой профессии зарплата в 300 тысяч рублей вполне реальна.
На действительно высокую оплату своего труда начинающий data scientist может рассчитывать и за границей. Так, средняя зарплата начинающего специалиста в этой сфере в США составляет 68 054 доллара в год. После вычета всех налогов это более 4000 долларов в месяц.
Что должен уметь data scientist
studioloco / Shutterstock
Ключевой навык — задавать правильные сложные вопросы. Чтобы овладеть им, специалист должен понимать боли и проблемы бизнеса, говорить с ним на одном языке, чтобы получать нужную информацию.
Каждый вопрос рождает несколько гипотез — выводов, которые можно проверить с помощью данных. Если вопрос сформулирован верно, data scientist сможет построить модель для проверки гипотезы и протестировать её, получить результаты и применить их в бизнесе.
Среди технических навыков на первое место выходит Python — мощный язык программирования с понятным и логичным синтаксисом.
Чтобы разбираться в нём, не нужно быть опытным программистом или хотя бы «технарём». Достаточно уметь вызывать нужную функцию и задавать её параметры.
Кроме того, для Python существует множество готовых модулей для работы с большими данными, создания моделей и глубокого обучения.
Аналитики Mail.ru и HeadHunter установили, что для начинающих специалистов по большим данным владение Python требуется в 54% вакансий. Для трети компаний важно умение кандидата работать с SQL, для 17% — data mining: навыки поиска и сбора сырых данных для последующего анализа. В 15% вакансий уделяют внимание математической статистике, в 14% — методам анализа данных.
Как всему этому научиться
Чтобы овладеть всем этим на уровне, достаточном для поиска работы, не придётся получать второе высшее образование: хватит и курса «Профессия Data Scientist» от Skillbox.
С первого занятия вы будете постигать азы работы с Python, а позднее овладеете и языком R, который специально создавался для статистической обработки данных.
Вы научитесь работать с несколькими Python‑библиотеками, освоите различные базы данных PostgreSQL, SQLite3 и MongoDB.
Аналитика больших данных неразрывно связана с машинным обучением и нейронными сетями. Поэтому в курс включены ещё и фреймворки для обучения нейросетей Tensorflow и Keras, а также множество практических задач по созданию моделей для компьютерного зрения и лингвистики.
По окончании курса вы также сможете строить дашборды и интерактивную графику, чтобы наглядно представить результаты работы. В финале вы реализуете собственный проект — построите рекомендательную систему, которую можно будет добавить в портфолио. И всё это — под руководством опытных наставников.
Таким образом, всего через полтора года вы будете знать и уметь гораздо больше, чем средний кандидат на позицию дата‑сайентиста. И даже сможете записать полтора года обучения на курсе в свой стаж работы с большими данными. А значит, уже на старте претендовать на более высокую зарплату.
Освойте профессию будущего
Сколько стоит обучение
Дорогое обучение data science останавливает многих будущих специалистов, особенно сейчас, когда экономика нестабильна, а мир всё ещё борется с пандемией.
Зато у Skillbox — антикризисные цены и оплата частями.
До 31 августа вы можете записаться на курс «Профессия Data Scientist» со скидкой 40%, первые полгода учиться бесплатно, а после платить за своё обучение всего 4500 рублей в месяц.
Ещё один бонус для прошедших курс — два месяца изучения английского в школе EnglishDom. Интерактивные онлайн‑уроки помогут вам улучшить свой уровень — работодатели это оценят.
Профессия будет актуальна и через 15 лет — во всех направлениях бизнеса и в любой стране мира. Начать свой путь в ней вам тоже поможет Skillbox: по завершении 75% курса вы получите сопровождение личного карьерного консультанта, который поможет подготовиться к собеседованиям в компаниях — партнёрах этой образовательной платформы.
Кто такой Data Scientist, почему он так много зарабатывает и как им стать
Кажется, все вокруг только и говорят о Data Science. Её нарекают профессией будущего, а за последние несколько лет спрос на качественных специалистов только возрастает. В статье мы подробнее рассказываем о направлении — от сути работы и уровня зарплаты в России и зарубежом до онлайн-курсов, на которых можно освоить профессию с нуля.
Data Scientist — кто это?
В своих кругах его шуточно называют человеком, который знает статистику лучше, чем Software Engineer, и программирует лучше, чем средний статистик. Дата-сайентиста можно назвать экспертом по анализу массивов данных, который обладает техническими навыками для решения сложных задач, а также любопытством, чтобы эти задачи ставить.
Чем занимается Дата Сайентис?
Он ищет уникальные решения сложных задач, которые связаны с разными ограничениями — методологическими, техническими и другими.
Специальность требует практического опыта в статистическом анализе данных, определённых скиллов в построении математических моделей (от факторного до корреляционного анализов, от нейронных сетей до кластеризации), работы с огромными массивами данных и умения находить новые связи и закономерности.
В зависимости от специализации в результате работы получаются модели, прогнозирующие поведение пользователей в сети, погоды, курсов валют. Рекомендации музыки и фильмов, исходя из ваших предпочтений, — тоже Data Science.
Сколько зарабатывает Data Scientist?
Специалистом по большим данным можно работать практически везде, ведь каждой сфере бизнеса нужен анализ данных. На выбор предоставлены все варианты — фриланс, удалёнка или офис. Даже младший специалист в этой профессии получает больше среднестатистической зарплаты по стране.
Например, средняя зарплата Data Scientist в США — $91 тыс в год, причём она прямым образом зависит от опыта работы.В России цифра составляет от 60–70 тысяч рублей в месяц для новичков и доходит до 220 тысяч для опытных специалистов.
По данным HH.ru на май 2020 года получилась вот такая картина:
- Москва: 80–300 тыс рублей
- Санкт-Петербург: 70–270 тыс рублей
- Регионы: 30–120 тыс рублей
Много специалистов требуется в банковскую сферу, что подразумевает белую зарплату, ДМС и официальный отпуск. Другие фирмы открывают удалённые вакансии, поэтому неважно, где именно вы живёте, устроиться можно и на столичную компанию.
Как стать Data Scientist?
Если вы хотите заняться Data Science, то вам точно понадобятся навыки владения Python, учебник по математическому анализу и готовность учиться. Даже если у вас нет элементарных знаний, многие школы готовы обучить профессии с нуля. Приводим в пример несколько онлайн-курсов.
1. Профессия Data Scientist от Skillbox
18 месяцев изучения инструментов Data Science и Machine Learning. Курс содержит 8 блоков из 93 тематических модулей. Подходит для новичков в IT, начинающих программистов и аналитиков.
В программе: основы аналитики, статистики и теории вероятностей, машинное обучение, английский для IT-специалистов. Обучение под руководством личного наставника. В закрытом чате можно пообщаться с сокурсниками и преподавателями. По окончании курса выпускники получают диплом, проходят собеседования и стажировку.
2. Профессия Data Scientist от Нетологии
170+ часов практики написания предиктивных моделей для оптимизации бизнес-процессов. Грамотное управление данными и построение прогнозов с помощью нейросетей. Навыки машинного зрения и анализа текстов. Курс позволит прокачаться в профессии аналитикам и специалистам IT.
Продвинутая работа с БД, анализ данных на Python и создание рекомендательных систем. Студенты смогут использовать Machine Learning для бизнес-решений. Портфолио пополнится 5 крупными проектами, а эксперты помогут составить резюме и подготовиться к собеседованию.
3. Полный курс по Data Scientist от Skillfactory
Начальный онлайн-курс Data Science предназначен на новичков и длится 12 месяцев. За этот период учащиеся знакомятся с основами машинного обучения и работы с нейросетями.
В программу входит изучение азов проектирования, Python, визуализации данных в Pandas, Matplotlib, Seaborne и работа с информационными хранилищами. Предусмотрены курсы-тренажеры, индивидуальное сопровождение ментора, соревнования и хакатоны. Помощь в разработке не менее 10 проектов для портфолио. Выпускникам курсов выдаётся диплом об окончании курса.
4. Факультет «Искусственного интеллекта» в GeekBrains
18 месяцев изучения Data Science с нуля. Содержит 7 блоков. Подходит новичкам. Способствует продвижению в профессии специалистов по машинному обучению, искусственному интеллекту, анализу данных и Data Science.
Эксперты познакомят студентов с технологиями машинного обучения и нейронными сетями, научат решать бизнес-задачи. Ведение куратора и освоение английского для IT-специалистов. Дипломированным выпускникам гарантировано трудоустройство.
После обучения вас ждёт разнообразный выбор вакансий, потому что на специалистов по Big Data сейчас большой спрос. Не теряйте время и вливайтесь!
Материал опубликован в нашем блоге MOOC и социальных сетях: ВКонтакте,
Data Scientist: что он делает и сколько получает. Средняя зарплата в Data Science | OTUS
Сегодня о Data Scientist’ах не говорит только ленивый. В частности, всё чаще мы слышим (и небезосновательно) что это профессия будущего. Не менее часто говорят и о высоких зарплатах в Data Science. Что же, давайте посмотрим, сколько зарабатывают специалисты с опытом и без опыта в таких странах, как США, ЕС, Россия. Но для начала — краткий ликбез.
Data Scientist – это кто вообще?
Data Scientist’ы — это эксперты по анализу массивов данных. Такие специалисты часто обладают математическим складом ума, владеют статистическим анализом, умеют видеть закономерности и находить их. Задача Data Scientist’ов — создание моделей для совершенствования рабочих процессов, используя анализ данных и не только.
Как правило, Data Scientist’ы занимаются:
— сбором больших массивов данных, их видоизменением;
— решением бизнес-задач, используя анализ данных;
— работой с языками SAS, R, Python;
— работой со статистикой;
— аналитикой, машинным обучением;
— выявлением различных закономерностей и т. п.
Соответственно, хороший специалист должен владеть:
• статистикой, машинным обучением;
• языками программирования SAS, R либо Python;
• базами данных MySQL, Postgres;
• технологиями визуализации данных;
• Hadoop and MapReduce.
Это, конечно, далеко не всё, но, как бы там ни было, всем этим технологиям можно научиться, а зарплата Data Scientist того стоит.
Что говорят цифры?
Что же, перейдём к основной цели статьи — зарплате в сфере Data Science. Начнём с США.
Какова зарплата специалиста без опыта?
Как это принято в IT и не только в ИТ, зарплата зависит от опыта и уровня специалиста. Здесь тоже есть джуниоры, мидлы и сеньоры. Естественно, зарплата начинающего дата-сайнтиста будет самой низкой. Согласно рейтингу ZipRecruiter, она находится в пределах 69 000 $ в год или 5 750 в месяц. И это неплохо, если учесть, что средняя ЗП в США порядка 3,5 тыс. долларов в месяц.
Какова зарплата у младшего специалиста?
Если верить информации с веб-сайта Glassdoor, младший Data Scientist получает порядка 121 000 $ в год либо более 10 000 $ в месяц. Очень даже неплохо, если не сказать больше.
Сколько получает старший специалист?
Естественно, много. Конечно, никаких правил и границ тут нет, но цифры нам говорят, что такой спец может получать порядка 162 000 $ в год либо 13 500 $ в месяц. Да, есть к чему стремиться…
Но, стоит сразу сказать, что достичь такой ЗП не так уж просто. Мало того, вы должны быть экспертом с большой буквы и посвятить Data Science довольно много времени. Учтите это обстоятельство, ведь учиться придётся всю жизнь.
Сравниваем зарплаты в США и ЕС
Ну, с США и так всё понятно — эта страна хорошо известна своими ломовыми зарплатами. Давайте лучше глянем, сколько Data Scientist’ы получают в европейских странах.
Посмотрев статистику DataCareer, увидим, что наилучшими странами ЕС для работы в роли аналитика данных являются такие страны, как:
— Швейцария,
— Германия;
— Великобритания.
Конечно, зарплата меньше, чем в Соединённых Штатах Америки, но всё равно и младшие, и старшие Data Scientist’ы получают весьма неплохо. Если говорить об экспертах с опытом, то в Швейцарии их годовой заработок превышает 100 тыс. евро в год.
Средняя зарплата Data Scientist’а в РФ
Вот мы и подошли к отечественному рынку труда в сфере Data Science. Здесь, как и везде, многое тоже зависит от опыта. Но, как это часто бывает, в ИТ-сфере даже джуниор получает больше, чем среднестатистический россиянин. В декабре 2019 года эти цифры были следующими (по данным hh.ru):
• Москва: 120 000 — 230 000 руб.;
• Санкт-Петербург: 70 000 — 180 000 руб.;
• Регионы: 40 000 — 120 000 руб.
При официальном трудоустройстве вас ждут белая ЗП и полный соцпакет. Если речь идёт об ИТ-компаниях, то тут можно упомянуть всевозможные «плюшки», характерные для этой сферы. Но вы не ограничены «айти», т. к. многие специалисты этого профиля требуются сегодня и в банковскую область.
Кроме того, есть вариант и удалённой работы, ведь самое главное — быть хорошим и востребованным специалистом. А вот чтобы им стать, придётся попотеть. Один из вариантов — специализированные курсы в OTUS.
При подготовке статьи использовались следующие материалы:
Чем занимается специалист по Data Science и как начать работать в этой области? — Академия Яндекса
Специалист в области Data Science строит на основе данных модели, которые помогают принимать решения в науке, бизнесе и повседневной жизни.
Он может работать с неструктурированными массивами информации в разных сферах: от выявления элементарных частиц в экспериментах на БАК, анализа метеорологических факторов, анализа данных о перемещениях автотранспорта до исследования финансовых операций, поисковых запросов, поведения пользователей в Интернете.
В результате получаются модели, которые прогнозируют погоду, загруженность дорог, спрос на товары, находят снимки, где могут оказаться следы нужных элементарных частиц, выдают решения о предоставлении кредита, могут рекомендовать товар, книгу, фильм, музыку.
Анна Чувилина, автор и менеджер программы «Аналитик данных» Яндекс.Практикума, рассказала, какие задачи решает специалист в области Data Science или датасаентист, в чем состоит его работа и чем он отличается от аналитика данных.
Что такое Data Science?
Data Science — это применение научных методов при работе с данными, чтобы найти нужное решение. В широком смысле, естественные науки основаны на Data Science. Например, биолог проводит эксперименты и анализирует результаты для проверки своих гипотез. Он должен уметь обобщать частные наблюдения, исключать случайности и делать верные выводы.
Датасаентист работает с данными так же, как ученый в любой другой сфере. Он использует математическую статистику, логические принципы и современные инструменты визуализации, чтобы получить результат.
Сбор данных — это способ измерить процессы вокруг нас. А научные методы позволяют расшифровать большие массивы данных, найти в них закономерности и применить для решения конкретной задачи.
Кто такой специалист по Data Science?
Датасаентист обрабатывает массивы данных, находит в них новые связи и закономерности, используя алгоритмы машинного обучения, и строит модели. Модель — это алгоритм, который можно использовать для решения бизнес-задач.
Например, в Яндекс.Такси модели прогнозируют спрос, подбирают оптимальный маршрут, контролируют усталость водителя. В результате стоимость поездки снижается, а качество растет. В банках модели помогают точнее принимать решения о выдаче кредита, в страховых компаниях — оценивают вероятность наступления страхового случая, в онлайн-коммерции — увеличивают конверсию маркетинговых предложений.