ML Engineer (GigaChat Data)

По договоренности


Мы — команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.

Наши основные направления:

• Validation & Metrics — инструменты валидации и замера моделей

• Data Engineering — пайплайны чистки и синтеза данных

• Code & Technical Data — генерация кодовых/технических данных

• MLOps — хостинг и использование open source моделей

• Model Training — эксперименты с LoRA и SFT.

Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных — приходи к нам.

Обязанности

  • разработка инструментов для валидации и замера качества моделей и систем контроля качества данных
  • создание метрик оценки производительности и точности LLM
  • автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки
  • построение и оптимизация пайплайнов чистки и синтеза данных
  • генерация высококачественных кодовых и технических датасетов
  • создание синтетических данных для обучения моделей на технических задачах
  • поддержка инфраструктуры для хостинга open source моделей
  • интеграция и использование open source модели в продуктовых решениях
  • обучение LoRA адаптеров для экспериментальных задач
  • проведение SFT обучения в рамках исследований данных
  • анализ результатов экспериментов и интерпретация подходов.

Требования

  • отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)
  • опыт работы с LLM (как open source: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude)
  • понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация
  • навыки построения ML пайплайнов и автоматизации процессов
  • понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения
  • понимание основ MLOps и работы с контейнеризацией (Docker).

Будет плюсом:

  • опыт с фреймворками для работы с агентами и RAG
  • знание подходов к fine-tuning (LoRA, QLoRA, SFT)
  • опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W&B)
  • понимание принципов работы с кодовыми данными и техническими текстами
  • опыт развертывания и мониторинга ML-моделей в production.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

Задачи: Настройка и сопровождение рабочих мест (Windows, macOS, iOS, Android, Linux); Поддержка мобильной техники, ноутбуков, планшетов, периферии Интеграция пользовательских устройств с корпоративными ИТ-системами; Поддержка сервисов Microsoft (AD, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Управляющая компания РОСНАНОУправляющая компания РОСНАНО
  • Москва
6 дней назад
до 250 000 ₽
Выше средней на 31%
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ : Data Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
7 дней назад
до 210 000 ₽
Выше средней на 10%
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
5 дней назад
до 220 000 ₽
Выше средней на 15%
... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer. ... НАШИ ОЖИДАНИЯ ОТ УСПЕШНОГО КАНДИДАТА: Опыт работы в роли data engineer ≈ 5 лет (Обязательно); Опыт работы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
12 дней назад
до 150 000 ₽
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
19 дней назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer ФУНКЦИОНАЛЬНЫЕ ОБЯЗАННОСТИ ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
5 дней назад

Похожие вакансии

до 250 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
до 210 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
до 220 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.