Вакансия “Руководитель направления эксплуатации“

Описание вакансии:
|
|
Вид работы: |
#руководящая
#общение с людьми
#в офисе
|
Рабочее место: |
•
Стационарное рабочее место
|
Тип занятости: |
•
Постоянная работа
|
График работы: |
•
полный день
|
Опыт работы: | • Более 3-х лет |
Требования: |
•
Базы данных
•
Kubernetes
•
Управление командой
•
MSSQL
•
Microsoft
•
Linux
•
IT
•
Разработка платформы
|
Дополнительно: |
•
Работа крупнейшего российского маркетплейса Ozon обеспечивается несколькими сотнями серверов, расположенных в нескольких дата-центрах. Чтобы поддерживать высокую степень эффективности разворачивания и работы тысяч приложений, предоставляющих сервис миллионам клиентов и продавцов, быстро и надежно хранить и обрабатывать петабайты информации, мы используем только те технологии, которые зарекомендовали себя надёжными и достаточно гибкими в этих условиях: Linux, Kubernetes, PostgreSQL, Hadoop. Масштаб и сложность нашей инфраструктуры требуют от команды, занимающейся её развитием и поддержкой, особой культуры работы, собранности и подготовки. На данный момент у нас открыта вакансия руководителя направления эксплуатации, человека, отвечающего за развитие и работоспособность всех серверных систем компании. Что вам предстоит: Управление командой инженеров (40+ человек) - разработка, operations, kuber ops, l2 ops, MSSQL DBA, Win ops;
Подготовка и поддержка отказоустойчивости на уровне DC-1;
Поддержка и развитие К8S;
Разработка, эксплуатация и внедрение К8S Stateful;
Регулярное планирование, ведение ключевых проектов и встреч по результатам работы, развитие коллектива, проведение ревью по результатам работы команды каждые полгода;
Решение архитектурных задач совместно с командой разработки платформы;
Участие в разработке стратегии развития инфраструктуры компании: упреждающее планирование серверного парка, реализация мер по обеспечению непрерывности бизнеса, разработка стратегии размещения в ЦОД.
Что мы ожидаем от вас: Опыт работы в роли руководителя команд эксплуатации, состоящих из 10 и более инженеров, отвечающих за работоспособность инфраструктуры реального бизнеса;
Опыт практического администрирования Linux-систем, понимание принципов работы Kubernetes и современных баз данных;
Навыки проектной работы: регулярное планирование, работа со сроками;
Опыт эффективной координации работ по разрешению инцидентов высокой степени критичности;
Желание и готовность работать в культуре, в которой каждый значимый инцидент неизбежно сопровождается до определения причины его возникновения и реализации доработок, исключающих его повторение;
Умение работать эффективно в условиях динамичного масштабирования команды;
Привычка работать с фактами, принимать решения на основе данных. |