Data Engineer / Дата инженер (Middle/Senior)

до 250 000 ₽

  • Площадь Ильича
  • Марксистская
  • Третьяковская

Привет! Мы — Genotek, молодая и современная medtech компания. Работаем с технологиями будущего: проводим исследования, которые помогают людям узнать всё про свои гены, происхождение и особенности здоровья.

Сейчас мы находимся в поиске опытного инженера данных, который возьмет на себя разработку и внедрение масштабируемой системы обработки событий (event processing pipeline). Вам предстоит построить отказоустойчивую платформу для сбора, трансформации и анализа данных.

Чем предстоит заниматься:

  • Мониторинг, оптимизация и масштабирование баз данных (MySQL, ClickHouse): анализ медленных запросов, настройка индексов, планирование и реализация партиционирования и шардинга.

  • Полный цикл разработки витрин данных: от проектирования и рефакторинга существующих до создания новых. Очистка сырых данных, дедубликация, оптимизация ETL-процессов.

  • Интеграция данных из внешних источников (Яндекс.Метрика, Roistat и др.) через API: обеспечение отказоустойчивости, обработка ошибок, retry-логика, валидация и обеспечение качества и полноты данных.

  • Разработка, поддержка и оптимизация сложных данных пайплайнов в Apache Airflow (создание новых DAG).

  • Подготовка и поддержание актуальной технической документации: схемы данных, дата-словари, описание витрин и ETL-процессов.

  • Участие в процессе разработки: code review, работа по Git Flow, внедрение и соблюдение стандартов кодирования.

Что мы ожидаем от вас:
  • Опыт коммерческой разработки в роли Data Engineer от 3-х лет (для Middle) и от 5-ти лет (для Senior).

  • Продвинутый SQL: глубокое понимание и большой опыт написания и оптимизации сложных запросов.

  • Опыт работы с СУБД:

    • MySQL: знания по оптимизации производительности (индексы, анализ execution plan).

    • ClickHouse: понимание специфики column-oriented БД

  • Сильный Python для ETL: опыт написания надежного и эффективного кода для данных пайплайнов (библиотеки: pandas, SQLAlchemy, requests и т.д.).

  • Глубокое знание Apache Airflow: опыт создания сложных, отказоустойчивых и идемпотентных DAG, использование сенсоров, хуков, XCom.

  • Опыт построения и поддержки DWH/витрин данных: понимание принципов dimensional modeling (звезда, снежинка), типов таблиц (факты, измерения).

  • Навыки работы с API: опыт интеграции с различными REST API (пагинация, ограничения, обработка ошибок, retry-механизмы).

  • Приверженность best practices: уверенная работа с Git (Git Flow), обязательный опыт проведения code review, понимание принципов CI/CD

  • Высшее профильное образование.

Будет плюсом:
  • Опыт построения инфраструктуры данных с нуля (greenfield project).

  • Знание концепций и инструментов обеспечения Data Quality (валидация, мониторинг аномалий).

  • Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes).

  • Базовое понимание WEB-технологий (React/Angular) на уровне, достаточном для взаимодействия с фронтенд-разработчиками.

  • Знание облачных платформ (Yandex Cloud, AWS) и их сервисов для данных.

Что мы предлагаем:

  • Оформление по ТК РФ и его полное соблюдение (оплачиваемые отпуска, больничные), бонусы работы в аккредитованной IT-компании;

  • Формат работы: удалённый, но при желании можно ходить в офис в Москве или в Питере (в Питере можно ходить в офис в ИТМО или на Пионерской)

  • ДМС, занятия английским в Skyeng, психологические консультации от сервиса Youtalk и Генетический паспорт Genotek для всех сотрудников;

  • Дружную команду и уважительное отношение к инициативе

Пришли нам сопроводительное письмо, в котором расскажешь про свой самый сложный проект на Python.


Адрес: Россия, Москва, Наставнический переулок, 17с1
Показать на большой карте

Поделиться:

Опубликована 4 часа назад

Похожие вакансии

We’re looking for an experienced Data Engineer to join our remote team. We work in a very challenging business domain, the HealthCare space. Responsibilities: -Design, build and operationalize large enterprise data solutions using the AWS stack inclu...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Кадровое Агентство ОК КонсалтКадровое Агентство ОК Консалт
  • Москва
4 часа назад
Бренд MIXIT- российская косметическая компания, концепт истинной красоты, экспертизы и инноваций. Мы разрабатываем только оригинальные формулы, отвечающие современным стандартам и трендам. В 2014 году небольшой командой профессионалов был основан бре...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании MIXITMIXIT
  • Москва
2 дня назад
ОЦРВ - часть одной из самых стабильных и масштабных структур в стране – ОАО «РЖД». Нас уже более 1200 человек. Вместе мы работаем над цифровизацией ж/д отрасли. Проект : разработка корпоративного хранилища данных в рамках цифрового сервиса «РЖД Медиц...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Отраслевой центр разработки и внедрения информационных систем / ОЦРВОтраслевой центр разработки и внедрения информационных систем / ОЦРВ
  • Москва
4 дня назад
300 000 - 380 000 ₽
Рыночная зарплата
LIAN — системный интегратор с фокусом в аналитике и управлении данными. Мы работаем в трех направлениях: 1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании LIANLIAN
  • Москва
8 дней назад
«М.ТЕХ» - АККРЕДИТОВАННАЯ ИТ-КОМПАНИЯ В ГРУППЕ «М.ВИДЕО-ЭЛЬДОРАДО» разрабатывает более 100 инновационных ИТ-продуктов на основе современной микросервисной и облачной инфраструктуры, больших данных, биометрии, ИИ и машинного обучения для улучшения кач...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
  • Москва
7 дней назад

Похожие вакансии

Логотип компании Кадровое Агентство ОК КонсалтКадровое Агентство ОК Консалт
Логотип компании Отраслевой центр разработки и внедрения информационных систем / ОЦРВОтраслевой центр разработки и внедрения информационных систем / ОЦРВ
300 000 - 380 000 ₽
Логотип компании LIANLIAN
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.