Sfera-rabota.ru

Вакансия “Data engineer“

Организация

СБЕР

у этого работодателя ещё 804 активные вакансии
СБЕР

Id: 984629
Активная Вакансия
Обновлена: 10.07.2023
Тщательный отбор
Должность
Data engineer
Заработная плата
по договоренности
Описание вакансии:
Рабочее место:
Стационарное рабочее место
Адрес места работы:
Москва, Поклонная улица 3
Тип занятости:
Постоянная работа
График работы:
полный день
Опыт работы: от 1 года
Требования:
Python
Hadoop
Spark
DWH
Дополнительно:

Мы интернациональная команда, занимающаяся адаптацией, ⁣ ⁣локализацией и созданием новых сервисов экосистемы для дочерних банков экосистемы Сбер.

Чем предстоит заниматься:

полным циклом разработки всех слоев хранилища данных и отображения отчетности

участвовать в составлении плана проекта, оценка проектных сроков и рисков

участвовать в проектировании системы, решать сложные исследовательские задачи по реализации никем ранее не реализованного функционала

развивать корпоративное хранилище и витрины данных (АС Облако данных) для развития международного бизнеса Сбербанка. Участвовать в сложных интеграционных проектах по развитию корпоративного DWH (преимущественно Hadoop, возможно, интеграции с БД Oracle и Teradata) в роли разработчика.

разрабатывать и проектировать потоки данных, алгоритмы загрузки и обработки данных в Hadoop с использованием Apache Spark

разрабатывать и оптимизировать ETL, обеспечивать производительность и стабильность, при необходимости участвовать в анализе инцидентов

организовывать оптимальный процесс разработки

участвовать в приемке системы

Мы ожидаем:

опыт работы в области Data engineer от одного года

Работа с данными:

знание SQL - простые запросы, Join`ы, агрегаты, группировки, вложенные запросы

знание python: стандартные структуры данных (dict, list, set, модуль collections), pandas, numpy, h5рy

опыт работы с Hadoop (Hive, Spark, HBase) является плюсом

Моделирование:

Feature Engineering: - методы оценки значимости и отбора признаков, методы уменьшения размерности, приемы работы с текстом

Model - умение различать основные классы задач (регрессия, классификация, кластеризация) и формулировать бизнес-задачу в их терминах. Знать основные методы и знать api по их использованию

Python - sklearn, numpy, scipy, xgboost (в порядке убывания приоритета)

Evaluation:

умение различать методы оценки качества модели под основные классы задач и понимать плюсы и минусы их применения. (f1, precision, recall, roc auc, mse, rmse, silhouette)

опыт работы с инструментами для организации и автоматизации работы: GridSearch, pipelines, ide, git, Jira, Confluence

понимание методологии Agile и DevOps

владение английским языком на уровне чтения технической документации

Мы предлагаем:

работа в команде профессионалов, возможность разрабатывать уникальные и крупные проекты масштаба нашей страны

можно работать в офисе или в смешанном графике

конференции и обучение на корпоративных или вендорских курсах за наш счёт

отличная ДМС, включая несчастные случаи и тяжелые заболевания

льготные условия по ипотеке и кредитам

материальная помощь и социальная поддержка

корпоративная пенсионная программа

офис в бизнес-центре Поклонка (м. Кутузовская)

Loading...