ML Engineer (GigaChat Data)

По договоренности


Мы — команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.

Наши основные направления:

• Validation & Metrics — инструменты валидации и замера моделей

• Data Engineering — пайплайны чистки и синтеза данных

• Code & Technical Data — генерация кодовых/технических данных

• MLOps — хостинг и использование open source моделей

• Model Training — эксперименты с LoRA и SFT.

Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных — приходи к нам.

Обязанности

  • разработка инструментов для валидации и замера качества моделей и систем контроля качества данных
  • создание метрик оценки производительности и точности LLM
  • автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки
  • построение и оптимизация пайплайнов чистки и синтеза данных
  • генерация высококачественных кодовых и технических датасетов
  • создание синтетических данных для обучения моделей на технических задачах
  • поддержка инфраструктуры для хостинга open source моделей
  • интеграция и использование open source модели в продуктовых решениях
  • обучение LoRA адаптеров для экспериментальных задач
  • проведение SFT обучения в рамках исследований данных
  • анализ результатов экспериментов и интерпретация подходов.

Требования

  • отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)
  • опыт работы с LLM (как open source: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude)
  • понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация
  • навыки построения ML пайплайнов и автоматизации процессов
  • понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения
  • понимание основ MLOps и работы с контейнеризацией (Docker).

Будет плюсом:

  • опыт с фреймворками для работы с агентами и RAG
  • знание подходов к fine-tuning (LoRA, QLoRA, SFT)
  • опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W&B)
  • понимание принципов работы с кодовыми данными и техническими текстами
  • опыт развертывания и мониторинга ML-моделей в production.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована месяц назад

Похожие вакансии

Мы расширяем команду и ищем опытного Специалист технической поддержки / IT Support Engineer (L1–L2) Что ...
  • Полный день
  • Опыт от 3 лет
Логотип компании red_mad_robotred_mad_robot
  • Москва
21 день назад
Johnson &Johnson is looking for a talented Reliability Engineer to join our Russia-based IT organization ... Reliability Engineer will be responsible for ensuring the reliability, availability, and performance ... Proven experience as a Reliability Engineer, Site Reliability Engineer, or similar role supporting enterprise-scale ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Johnson & JohnsonJohnson & Johnson
  • Москва
3 дня назад
Она образована в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной ... Wildberries и Russ — это лидер рынков e-commerce и наружной рекламы в России с современной IT-инфраструктурой ... Направление работы: Сейчас мы ищем опытного QA Engineer в нашу команду инфраструктурной разработки.
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
6 часов назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER в офис в Москве.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
19 часов назад
Международная IT-компания, специализирующаяся на создании высоконагруженных онлайн-сервисов ищет в команду ... Кого ищем: Опыт работы в роли DWH Developer / Data Engineer / Database Developer от 3х лет.
  • Полный день
  • Опыт от 3 лет
Логотип компании ТопассистентТопассистент
  • Москва
3 дня назад
Опыт работы на позиции Data Scientist (Machine Learning или Deep Learning Engineer) от 3-4 лет. ... Что мы предлагаем: Работу в аккредитованной IT-компании. Расширенный полис ДМС.
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
6 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.