Data Engineer (RAG / AI Platform)

По договоренности

Москва

Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных костылей.
Наша цель — сделать RAG таким же привычным компонентом платформы, как SQL, Spark или CI/CD.
Для этого мы ищем Platform Data Engineer, который поможет сформировать и стандартизировать RAG-pipeline — от загрузки данных и чанкирования до метрик качества и retrival-механизмов. Дополнительным вызовом будет создание агентов для целей Data Platform используя RAG.

⚙️ Задачи:

Проектировать и внедрять RAG-пайплайны уровня платформы: ingestion данных, чанкирование, эмбеддинги, retrival, оценка качества ответов.
Исследовать SOTA-методы RAG (chunking, reranking, hybrid retrival, eval frameworks — RAGAS, TruLens, Langfuse, etc.) и адаптировать их под инфраструктуру Data / Dev Platform.
Создавать reusable компоненты (Python-библиотеки, API, Helm-чарты, шаблоны пайплайнов) для команд-потребителей.
Встраивать RAG в экосистему платформы: от self-service интерфейсов до observability и developer experience.
Разрабатывать метрики качества и мониторинг RAG-решений: faithfulness, groundedness, latency, coverage.
Агрегировать и распространять практики подготовки данных для использования в RAG.
Участвовать в воркшопах и кодлабах, обучать команды применению AI в продакшене.

🧩 Требования:

Уверенные знания Python, SQL.
Понимание архитектуры RAG-систем.
Опыт работы с LLM и embeddings — OpenAI, Gemini, Mistral.
Опыт работы с Docker, Git, Linux, Bash, знание CI/CD.
Понимание общих принципов устройства СУБД (реляционных + NoSQL).
Знание подходов по организации ETL-процессов, инструментов построения ETL.

🧩 Будет плюсом:

Практический опыт с векторными БД (Milvus, Qdrant, FAISS, Chroma).
Понимание ML evaluation и метрик RAG-решений.
Опыт с LangChain / LlamaIndex .
Опыт построения retrival-и-eval pipelines в проде.
Знание Trino / ClickHouse / Greenplum / Spark — как источников данных.
Понимание принципов System Design / архитектуры ML-платформ.

⚡ Откликнуться на hh.ru

Опубликована 3 дня назад

Data Engineer

Обязанности: - Разработка пайплайнов для обработки данных; - Создание витрин, маппингов для данных; - Обследование и профилирование банковских источников данных, исследование моделей данных источников; - Валидация и проверка качества данных, поиск пр...

Полный день
Опыт от 3 лет

ИЦ АЙ-ТЕКО

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Data Engineer

Приглашаем присоединиться к дружной команде, работающей с большими данными глобальных рынков. Наша работа – строить новые потоки данных и разрабатывать интерактивные визуализации на их основе для повышения эффективности работы sales подразделений бан...

Полный день
Опыт от 3 лет

IBS

Москва

4 дня назад

⚡ Откликнуться на hh.ru

Data Engineer

Ищем коллегу, который погрузится в тонкости работы экосистемы данных в Okko и поможет в решении таких задач как: внедрение ETL-процессов на Airflow; создание витрин данных; участие в построении DWH; участие в проектировании модели данных; администрир...

Полный день
Опыт от 3 лет

Okko

Москва

4 дня назад

⚡ Откликнуться на hh.ru

Data Engineer (Рекомендации)

Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. Рекомендации - команда занимается построением пла...

Полный день
Опыт от 3 лет

WILDBERRIES

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Senior Data Engineer

Вы можете присоединиться к команде, которая занимается генеративной аналитикой и исследованиями того, как лучше решать существующие задачи с помощью RAG. Вы будете: заниматься поиском и внедрением передовых подходов к работе с данными с использование...

Полный день
Опыт от 3 лет

СБЕР

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Data Engineer

Центр развития Департамента информационных технологий Банка России ищем коллегу – профессионала и единомышленника. ДИТ формирует ИТ-политику Банка России, систематизирует все изменения и инициативы в этом направлении, а Центр развития ДИТ реализует п...

Полный день
Опыт от 3 лет

Центральный банк Российской Федерации (Банк России)

Москва

5 дней назад

⚡ Откликнуться на hh.ru

Data Engineer (RAG / AI Platform)

По договоренности

Похожие вакансии

Data Engineer

Data Engineer

Data Engineer

Data Engineer (Рекомендации)

Senior Data Engineer

Data Engineer

Вакансия в подборках

Похожие вакансии