Разработчик (Data Engineer)

до 300 000 ₽

Выше средней на 36%
  • Строгино
  • Мякинино
  • Пенягино

ТехВилл – IT-компания и партнёр ВкусВилл по развитию цифровых решений.

Мы отвечаем за разработку мобильных и web- приложений, автоматизацию бизнес-процессов, искусственный интеллект, devops, инфобез ВкусВилла.

Нашими решениями пользуется свыше 1 000 000 клиентов и сотрудников ВкусВилла.

На данный момент мы ищем Data Engineer, который будет участвовать в роботизации и автоматизации процессов во «ВкусВилл».

Обязанности:
  • Стек: Python, Apache Airflow, Docker, SQL (DuckDB), PyArrow, MinIO(S3), Apache Superset.
  • Поддержка и развитие инфраструктуры обработки данных с роботов.
  • Написание DAG'ов.
  • Оптимизация SQL-запросов к Data Lake.
  • Создание дашбордов в Superset.
Требования:
  • Python (продвинутый уровень).

  • Опыт написания production-кода, понимание особенностей работы с большими данными (эффективность операций, например, сложность append и альтернативы).

  • Уверенная работа с библиотеками: pyarrow (создание/чтение таблиц, партицирование), duckdb (встраиваемый SQL-движок).

  • Опыт использования многопроцессности (multiprocessing, concurrent.futures) для параллельной обработки данных.

  • SQL (средний уровень).

  • Умение писать аналитические запросы (агрегации, оконные функции).

  • Понимание разницы между DuckDB и Pandas для аналитических задач.

  • Apache Airflow.

  • Понимание архитектуры Airflow: DAG, операторы (Python, Bash, Docker), XCom.

  • Практический опыт написания DAG'ов для ETL-процессов.

  • Понимание, зачем используется Airflow.

  • Docker и контейнеризация.

  • Уверенное владение Docker CLI: inspect, system, ps, rm, exec и другими командами для диагностики.

  • Знание docker compose: чтение и написание конфигураций, добавление новых сервисов, работа с сетями и томами.

  • Навыки отладки внутри контейнеров (просмотр логов, проверка состояния файловой системы, запуск вспомогательных команд).

  • Хранение данных и форматы.

  • Опыт работы с объектными хранилищами, совместимыми с S3 (MinIO или аналоги).

  • Понимание, зачем используется Parquet (колоночное хранение, сжатие, эффективность запросов) и его преимущества перед построчными форматами.

  • Визуализация данных (Apache Superset).

  • Готовность заниматься рутинной работой по созданию и поддержке дашбордов.

  • Понимание структуры Superset: виртуальные датасеты, SQL Lab 7

  • Soft Skills.

  • Высокая обучаемость и способность быстро погружаться в существующую архитектуру (bus factor = 1).

  • Системное мышление: понимание полного цикла работы данных от загрузки до визуализации (Jupyter → Airflow → duckdb → lakeFS → MinIO → duckdb → Jupyter/Superset).

  • Ответственность и готовность оперативно решать проблемы поддержки (что-то сломалось — надо чинить).

Преимущества (будет плюсом):

  • Знание ROS 2 (Robot Operating System) и формата .bag: понимание структуры топиков, сообщений, типов данных сенсоров (лидары, камеры, одометрия).
  • Опыт работы с lakeFS: понимание концепции версионирования данных (ветвление, коммиты) и того, как lakeFS интегрируется с MinIO.
  • DevOps-скиллы: базовое администрирование Linux (работа с дисками, памятью, процессами); опыт работы с системами логирования и мониторинга.
Условия:
  • Работа в аккредитованной IT-компании.
  • Гибрид; На ключевых этапах проекта требуется работа на месте. Ожидается готовность к периодическим визитам.
  • Официальное оформление с первого дня работы и поддержка куратора во время адаптации.
  • Прозрачная система развития: понятные грейды, внутреннее и внешнее обучение, индивидуальные планы развития и матрицы компетенций.
  • Экологичная культура и адекватные руководители.
  • Компенсация затрат на медицинские услуги, ментальное благополучие, спорт, тимбилдинги и использование AI-помощников.
  • Бонус 15% с покупок во ВкусВилл.
  • Социальная ответственность: поощряем донорство, оказываем материальную помощь при рождении ребёнка.
  • Партнерская программа «Зелёный свет»: за рекомендации знакомых специалистов можно получить до 50 000 руб.

Сравнение со средней зарплатой в похожих вакансиях:

190k

292k

100k

240k

375k


Адрес: Россия, Москва, улица Кулакова, 20к1
Показать на большой карте

Поделиться:

Опубликована 2 часа назад

Похожие вакансии

... оркестраторами ETL процессов владение SQL на уровне native speaker уверенное знание Python опыт работы с Big Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
2 часа назад
Департамент информационных технологий Москвы создает и развивает цифровые проекты, которые делают столицу комфортнее, а жизнь горожан — удобнее и мобильнее. Для системы управления столицей технологии — это незаменимый инструмент, который применяется ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
6 дней назад
Мы ищем data engineer’а в команду, занимающуюся развитием ML-подходов в страховании. ... Обязанности: Заниматься разработкой новых data-пайплайнов с использованием Pyspark, Airflow, как и батч ... (kappa И lambda - архитектуры); Знакомство с Kafka и Airflow, понимание их роли в data-пайплайне; Знание ...
  • Полный день
  • Опыт от 3 лет
Логотип компании АльфаСтрахованиеАльфаСтрахование
  • Москва
6 дней назад
Мы – команда разработки DATA решений для Программы Лояльности СберСпасибо. ... В роли Data Engineer Вы получите опыт работы с настоящими большими данными, современным технологическим ... Engineer или ETL Developer Отличное знание SQL и современных реляционных/MPP СУБД (на выбор PostgreSQL ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СберСпасибоСберСпасибо
  • Москва
6 дней назад
Мы — команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях ... Обязанности подготовка данных для обучения и тестирования моделей разработка и поддержка data pipeline ... базовая статистика опыт в speech-задачах (ASR, VAD, diarization, keyword spotting) опыт построения data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
2 часа назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.