Data engineer GigaData

По договоренности


Проект: Создаем поисковый сервис для ответа на запросы пользователей на естественном языке. Ломаем барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Предоставляем GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы, включая вопросы о свежих новостях и событиях.

Обязанности

  • разрабатывать и настраивать механизмы для автоматизированного сбора данных, обеспечивать корректность и полноту сбора, оптимизировать процессы таким образом, чтобы все работало быстрее и без ручного вмешательства
  • разрабатывать пайплайны для предобработки данных и преобразовывать их в формат, оптимальный для дальнейшего хранения, обработки и использования в задачах поиска
  • проектировать и реализовывать хранилища, которые позволили бы эффективно решать задачи поиска
  • применять машинное обучение и искусственный интеллект для улучшения результатов работы, поддерживать корректную работу системы – мониторинг, диагностика и устранение неполадок, исправление старых багов и создание новых.

Требования

  • опыт работы с движками для распределенной обработки данных (Spark, Trino), оркестраторы Airflow
  • умение проектировать DWH, Data Lake, Data Management Platform
  • опыт построения и развития высоконагруженных систем
  • опыт разработки и оптимизации пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
  • продвинутый уровень владения Python и SQL

БУДЕТ ПЛЮСОМ:

  • опыт работы с таблицами формата Iceberg
  • опыт работы с индексами ElasticSearch/OpenSearch
  • опыт работы с GPU (инференс моделей).

Условия

  • комфортный современный офис - м. Кутузовская
  • ежегодный пересмотр зарплаты, годовой бонус
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.

Поделиться:

Опубликована 20 часов назад

Похожие вакансии

Мы в поиске Data Engineer для создания и поддержки витрин данных, использующихся для задач машинного ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
20 часов назад
Сейчас мы находимся в поисках Teamlead Data Engineer в команду Data office S7.
  • Полный день
  • Опыт от 3 лет
Логотип компании S7 GroupS7 Group
  • Москва
18 часов назад
Автоматизировать интеграцию данных: продажи, акции, цены, остатки, погода, календари • Работать в связке с Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании X5 TechX5 Tech
  • Москва
19 часов назад
Сейчас у нас открыта позиция Data Infrastructure Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании Лаборатория КасперскогоЛаборатория Касперского
  • Москва
19 часов назад
... архитектуры хранилищ данных Знания в области технологий сбора, хранения и обработки данных (Datalake, DWH, Data ... Lakehouse, Data Mesh и др.).
  • Полный день
  • Опыт от 3 лет
Логотип компании USETECHUSETECH
  • Москва
20 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.