Junior Data Engineer

По договоренности

  • Динамо
  • Тимирязевская
  • Дмитровская

ЭКОПСИ Консалтинг – лидер рынка управленческого и HR-консалтинга в России. У нас работают люди, возглавляющие списки самых авторитетных и востребованных экспертов в области управления персоналом в стране.
Наши клиенты – компании из ТОП-100 РБК, 9 из 10 крупнейших компаний России, более 30-ти лет успешно реализуем масштабные проекты для компаний 20+ отраслей бизнеса России и СНГ.

Мы создаем современную платформу для глубокой аналитики данных проведенных исследований. Вам предстоит стать ключевым участником команды, которая разрабатывает отказоустойчивое и масштабируемое хранилище данных (Data Lakehouse), объединяющее тысячи гигабайт новых данных из ClickHouse с историческими данными из различных источников. Мы предлагаем возможность работать с современным стеком технологий на реальной задаче построения хранилища данных с нуля. Вам предстоит решать интересные инженерные задачи и напрямую влиять на архитектурные решения.

Обязанности:

  • Разработка и поддержка ETL/ELT-процессов: создание, оптимизация и сопровождение надежных конвейеров данных для загрузки, очистки, трансформации и обогащения информации из разнородных источников;
  • Участие в построении архитектуры хранилища: реализация и поддержка концепции слоев данных с использованием современных табличных форматов и облачных хранилищ;
  • Работа с потоковыми данными: участие в проектировании и настройке компонентов для приема и обработки потоковых событий;
  • Оптимизация и мониторинг: обеспечение производительности и стабильности конвейеров. Выявление «узких мест», оптимизация запросов и процессов обработки данных;
  • Взаимодействие с командами: тесная работа с аналитиками данных, дата-сайентистами и разработчиками платформы для понимания потребностей и согласования моделей данных.

Требования:

Обязательно:

  • Базовый опыт (1-3 года) в роли Data Engineer или в смежной области (аналитика данных, разработка БД);
  • Уверенное знание SQL (PostgreSQL и пр.): самостоятельно проектирование БД, написание сложных запросов с CTE и оконными функциями, интеграция в ETL-пайплайны;
  • Опыт разработки на Python 3.13+ (библиотеки Pandas, PySpark). - Docker: Multi-stage сборка образов, оптимизация размера контейнеров (например, использование scratch).

Желательно:

  • Опыт работы с ClickHouse: Знание специфики, оптимизация запросов, понимание движков таблиц;
  • Расширенные навыки Python 3.13+: Глубокое знание новых функций (паттерн-матчинг, улучшения асинхронного кода), оптимизация производительности через async/await и контекстные менеджеры;
  • Понимание принципов ETL/ELT и опыт построения конвейеров данных;
  • Опыт работы с одним из распределенных движков обработки: Apache Spark (включая Spark SQL, DataFrames) или аналоги;
  • Kafka: Потоковая обработка данных через Kafka, настройка консюмеров и продюсеров;
  • Опыт миграции унаследованных данных из форматов (Excel, CSV) в структурированные хранилища.

Для нас важно:

  • Способность самостоятельно принимать и предлагать решения, а не просто выполнять задачи;
  • Умение переводить бизнес-требования в технические спецификации (например, преобразование описания метрик в алгоритм сбора и трансформации данных);
  • Знание основ статистики и математики для анализа данных;
  • Активность и готовность учиться новым технологиям.

Что мы предлагаем:

  • Культуру свободы и ответственности. Мы любим талантливых, высоко результативных людей и даём им «карт-бланш» для работы и творчества;
  • Интересные и разнообразные проекты — скучно не будет;

  • Работу в творческом коллективе — «интеллектуальный бульон», где легко рождаются новые идеи;

  • Постоянное развитие – мы не боимся делать то, что раньше не пробовали;

  • Гибкий график работы, гибрид после 6 месяцев работы, стильный комфортный офис на м. «Дмитровская»;

  • ДМС после испытательного срока.


Адрес: Россия, Москва, Новодмитровская улица, 2к1
Показать на большой карте

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

от 100 000 ₽
Мы занимаемся разработкой сложных и интересных решений в сфере видео стриминга и искусственного интеллекта (Computer Vision). Наш отдел разработки состоит из талантливых программистов и инженеров, создающих уникальные продукты. Ищем Data Engineer (CV...
  • Полный день
  • Опыт от 1 года
Логотип компании ФАЙВДЖЕНФАЙВДЖЕН
  • Москва
3 дня назад
Наша команда предоставляет для Банка ТОП-3 сервис обеспечения бизнес-процессов агрегированными и структурированными внешними данными. Разрабатываем дата-продукт внешнего профиля клиента, так же создаем решения под Hadoop+Scala+Spark, осваиваем разраб...
  • Полный день
  • Опыт от 1 года
Логотип компании Лига Цифровой ЭкономикиЛига Цифровой Экономики
  • Москва
5 дней назад
Azur Games – международный издатель и разработчик мобильных игр. В нашем портфолио более 150 успешных f2p проектов в разных жанрах: от увлекательного гиперкэжа до ярких мидкор тайтлов с синхронным PvP. И мы постоянно наращиваем темпы: расширяем портф...
  • Полный день
  • Опыт от 1 года
Логотип компании Azur GamesAzur Games
  • Москва
13 часов назад
до 250 000 ₽
Выше средней на 45%
НАЙМ В ООО «ПРОКТЕР ЭНД ГЭМБЛ ДИСТРИБЬЮТОРСКАЯ КОМПАНИЯ» Готовы вывести свою карьеру на новый уровень? Сообщество IT в P&G ищет дата-инженера, который присоединится к нашей команде в Москве! В этой роли вы будете создавать системы и решения с исп...
  • Полный день
  • Опыт от 1 года
Логотип компании Procter & GambleProcter & Gamble
  • Москва
3 дня назад
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», ...
  • Полный день
  • Опыт от 1 года
Логотип компании Rambler&CoRambler&Co
  • Москва
12 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.