Data Engineer (RAG / AI Platform)

По договоренности


Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных костылей.
Наша цель — сделать RAG таким же привычным компонентом платформы, как SQL, Spark или CI/CD.
Для этого мы ищем Platform Data Engineer, который поможет сформировать и стандартизировать RAG-pipeline — от загрузки данных и чанкирования до метрик качества и retrival-механизмов. Дополнительным вызовом будет создание агентов для целей Data Platform используя RAG.

⚙️ Задачи:

  • Проектировать и внедрять RAG-пайплайны уровня платформы: ingestion данных, чанкирование, эмбеддинги, retrival, оценка качества ответов.
  • Исследовать SOTA-методы RAG (chunking, reranking, hybrid retrival, eval frameworks — RAGAS, TruLens, Langfuse, etc.) и адаптировать их под инфраструктуру Data / Dev Platform.
  • Создавать reusable компоненты (Python-библиотеки, API, Helm-чарты, шаблоны пайплайнов) для команд-потребителей.
  • Встраивать RAG в экосистему платформы: от self-service интерфейсов до observability и developer experience.
  • Разрабатывать метрики качества и мониторинг RAG-решений: faithfulness, groundedness, latency, coverage.
  • Агрегировать и распространять практики подготовки данных для использования в RAG.
  • Участвовать в воркшопах и кодлабах, обучать команды применению AI в продакшене.

🧩 Требования:

  • Уверенные знания Python, SQL.
  • Понимание архитектуры RAG-систем.
  • Опыт работы с LLM и embeddings — OpenAI, Gemini, Mistral.
  • Опыт работы с Docker, Git, Linux, Bash, знание CI/CD.
  • Понимание общих принципов устройства СУБД (реляционных + NoSQL).
  • Знание подходов по организации ETL-процессов, инструментов построения ETL.

🧩 Будет плюсом:

  • Практический опыт с векторными БД (Milvus, Qdrant, FAISS, Chroma).
  • Понимание ML evaluation и метрик RAG-решений.
  • Опыт с LangChain / LlamaIndex .
  • Опыт построения retrival-и-eval pipelines в проде.
  • Знание Trino / ClickHouse / Greenplum / Spark — как источников данных.
  • Понимание принципов System Design / архитектуры ML-платформ.

Поделиться:

Опубликована день назад

Похожие вакансии

Приглашаем в стратегический проект импортозамещения и рефакторинга большинства банковских систем. В рамках проекта происходит отказ от Oracle и перерабатываются системы процессинга и учета большинства банковских продуктов (кредиты, карты, рассрочки, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Т-БанкТ-Банк
  • Москва
4 дня назад
ПК «Аквариус» – ведущий российский разработчик, производитель и поставщик компьютерной техники и ИТ-решений для государственных и корпоративных заказчиков. В 2021 «Аквариус» стал 4-м в рейтинге CNews Analytics среди крупнейших российских IT-разработч...
  • Полный день
  • Опыт от 3 лет
Логотип компании Аквариус, Группа компанийАквариус, Группа компаний
  • Москва
5 дней назад
КОМПАНИЯ «АЙ-ТЕКО» - ведущий российский системный интегратор и поставщик информационных технологий для корпоративных заказчиков. Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП-10 крупнейших IT-к...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
6 дней назад
Наша команда занимается генеративной аналитикой и исследованиями того, как лучше решать существующие задачи с помощью RAG. Вы будете: заниматься поиском и внедрением передовых подходов к работе с данными с использованием ИИ. Исследовать, как применен...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
6 дней назад
ООО «Ростелеком Специальные решения» - новый «игрок» в области автоматизации и оптимизации процессов федеральных органов исполнительной власти. Наша миссия - создавать надежные, инновационные и эффективные решения для повышения продуктивности госучре...
  • Полный день
  • Опыт от 3 лет
Логотип компании РостелекомРостелеком
  • Москва
9 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.