ETL / ML инженер
По договоренности
Привет!.redev — технологическая компания, создающая ИТ-решения для ритейла, e-com, логистики и не только. Мы нацелены на переосмысление подходов и создание нестандартных решений, а не просто выполнение задач.
Мы находимся в поиске ML-инженеров в финтех-команду, которая разрабатывает и поддерживает высоконагруженные аналитические и ML-платформы.
Проекты связаны с построением центрального хранилища данных (DWH), Feature Store, ETL-конвейеров и сервисов подготовки данных для аналитики и машинного обучения.
Работа с большими объёмами данных, промышленными ETL-процессами и современным data-стеком. Удалённый формат, долгосрочное сотрудничество.
Ты идеальный кандидат, если:
- Тебе интересно работать с большими данными и сложными высоконагруженными системами;
- Ты уверенно чувствуешь себя в SQL и Python и понимаешь, как сделать код не только рабочим, но и эффективным;
- Умеешь разбираться в существующем коде, оптимизировать его и улучшать архитектуру;
- Понимаешь, как устроены ETL-процессы, хранилища данных и пайплайны обработки;
- Любишь доводить решения до продакшена, а не ограничиваться прототипами;
- Готов взаимодействовать с командой: обсуждать решения, делать код-ревью, делиться экспертизой.
Чем предстоит заниматься:
Разрабатывать и поддерживать ETL-конвейеры обработки данных;
Работать с центральным хранилищем данных (DWH), Data Lake, SandBox, Feature Store;
Готовить и трансформировать данные для аналитики и ML-моделей;
Оптимизировать SQL-запросы и производительность пайплайнов;
Разрабатывать решения на Python / PySpark;
Интегрироваться с внутренними и внешними источниками данных (API, файлы, очереди);
Поддерживать и развивать Airflow-пайплайны;
Участвовать в код-ревью, вести техническую документацию;
Для senior-уровня — менторить коллег, участвовать в архитектурных решениях и онбординге.
Обязательные требования:
Опыт коммерческой разработки на Python (от 2 лет для middle, от 4 лет для senior);
Уверенное владение SQL, опыт написания и оптимизации сложных запросов;
Опыт работы с ETL-процессами и хранилищами данных;
Практический опыт работы с БД: Oracle / PostgreSQL / Greenplum;
Опыт работы с Airflow;
Опыт обработки больших объёмов данных (в том числе таблицы с миллиардами записей);
Знание и опыт работы с PySpark;
Понимание принципов построения надежных и масштабируемых data-пайплайнов.
Будет плюсом:
- Опыт работы в банковской или финтех-среде;
- Опыт работы с Feature Store;
- Опыт ML/NLP-проектов (Tesseract, spaCy, Natasha и др.);
- Опыт разработки API (FastAPI / Django);
- Знание DevOps-практик (Docker, CI/CD);
- Опыт работы с брокерами сообщений (Kafka, RabbitMQ).
Почему с нами классно?
- Формат работы - полностью удаленный;
- Гибкий формат оформления: ИП/СЗ/ГПХ по договорённости;
- Команда профессионалов, возможности для быстрого роста по задачам и грейду;
- Интересные проекты в бигтех-компаниях;
- Влияние на реальные бизнес-процессы.
Если ты активно развиваешься, готов к быстрому росту и интересным проектам — присоединяйся к команде .redev!
Опубликована 9 дней назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Частичная занятость
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва