Team Lead Data Engineer (GigaData)

По договоренности


Проект: Создаем поисковый сервис для ответа на запросы пользователей на естественном языке. Ломаем барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Предоставляем GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы, включая вопросы о свежих новостях и событиях.

Обязанности

  • разрабатывать и настраивать механизмы для автоматизированного сбора данных, обеспечивать корректность и полноту сбора, оптимизировать процессы таким образом, чтобы все работало быстрее и без ручного вмешательства
  • декомпозировать и ставить задачи для команды data инженеров, приоритизировать бэклог
  • разрабатывать MapReduce и потоковые пайплайны для предобработки данных и преобразовывать их в формат, оптимальный для дальнейшего хранения, обработки и использования в задачах поиска.
  • проектировать и реализовывать хранилища, которые позволили бы эффективно решать задачи поиска.
  • применять машинное обучение и искусственный интеллект для улучшения результатов работы, поддерживать корректную работу системы – мониторинг, диагностика и устранение неполадок, исправление старых багов и создание новых.

Требования

  • роль техлида команды из 3 инженеров: архитектура, распределение задач, контроль качества
  • умение проектировать DWH, Data Lake, Data Management Platform
  • понимание устройства векторных и полнотекстовых индексов
  • опыт разработки и оптимизации высоконагруженных пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
  • продвинутый уровень владения Python и SQL
  • опыт работы с движками для распределенной обработки данных (Spark, Trino), оркестраторы Airflow

Будет плюсом

  • опыт работы с таблицами формата Iceberg
  • опыт работы с GPU (инференс моделей).

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

Мы - команда ML-инженеров GigaChat Data.
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
8 дней назад
... (в том числе разрабатывать DAG для автоматизации) Участвовать в проработке и пилотировании нового: Data ...
  • Полный день
  • Опыт от 5 лет
Логотип компании VKVK
  • Москва
2 дня назад
X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и «Чижик», а также цифровыми сервисами «Vprok.ru Перекрёсток», 5Post, «Много Лосося» и медиаплатформой Food.ru. X5 Tech - IT-компа...
  • Полный день
  • Опыт от 5 лет
Логотип компании X5 TechX5 Tech
  • Москва
9 дней назад
450 000 - 550 000 ₽
Выше средней на 73%
Мы стремимся развивать искусственный интеллект, понимая, что создание безопасной и надежной платформы — фундамент нашей миссии и доверия клиентов. Мы ищем инженера, который поможет нам выстроить новые стандарты в сфере Trust & Safety. Если вам бл...
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
15 дней назад
Интеграция с системами телеметрии автономного транспорта Что предстоит делать: Проектировать и развивать Data ... Engineering Опыт проектирования DWH / Data Lake Опыт администрирования Hadoop: Spark/HDFS/Airflow/Hive ... Quality framework Опыт построения data-platform как продукта Работа у нас это: Забота о здоровье без ...
  • Полный день
  • Опыт от 5 лет
Логотип компании МТТЕХМТТЕХ
  • Москва
месяц назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.