Senior Data Scientist NLP | RND TeamLead в LegaTech

По договоренности


Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.

Наша цель — трансформировать работу юристов, бизнеса и госструктур через:

Автоматизацию анализа договоров и юридических документов

Интеллектуальную генерацию правовых текстов

Разработку специализированных юридических чат-ботов

Создание автономных юридических ИИ-агентов

Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.

Обязанности

LLM-ориентированные решения :

  • проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач
  • проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск)
  • проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач
  • оптимизация производительности LLM в production (латентность, стоимость, точность).

Продакшен-инжиниринг :

  • внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты)
  • интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch)
  • проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных
  • работа с SQL/No SQL БД

Лидерство и экспертиза :

  • участие в постановке технических требований и взаимодействие с бизнес-заказчиками
  • проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач
  • проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM
  • менторство младших коллег, code review, разработка best practices для команды
  • анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью
  • возможно лидирование RND команды проекта и позиция TeamLead.

Требования

  • высшее образование
  • опыт работы от 5 лет в DS/NLP, включая от 1 года работы с LLM, опыт с production.
  • готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны
  • глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering
  • опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM
  • знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex)
  • уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы
  • понимание MLOps: CI/CD, мониторинг дрифта данных, логирование
  • опыт трансформации бизнес-задач в технические требования
  • умение оценивать ROI DS-решений и балансировать между инновациями и практичностью
  • умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью.

Условия

  • комфортный современный офис
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована день назад

Похожие вакансии

Мы в поиске специалиста по Data Science, который будет внедрять современные ML и AI решений в различные ... Data-driven подход к разработке Разработка и внедрение AI-агентов на базе LLM (SOTA open-source решения ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Страховая компания Сбербанк страхованиеСтраховая компания Сбербанк страхование
  • Москва
месяц назад
Ищем Senior Data Scientist для развития рекламных технологий Ozon Банка.
  • Полный день
  • Опыт от 5 лет
Логотип компании OzonOzon
  • Москва
месяц назад
X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и «Чижик», а также цифровыми сервисами «Vprok.ru Перекрёсток», 5Post, «Много Лосося» и медиаплатформой Food.ru. X5 Tech - IT-компа...
  • Полный день
  • Опыт от 5 лет
Логотип компании X5 TechX5 Tech
  • Москва
25 дней назад
... для распределенной обработки данных (Spark, Trino), оркестраторы Airflow умение проектировать DWH, Data ... Lake, Data Management Platform опыт построения и развития высоконагруженных систем опыт разработки и ...
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
день назад
... research и proof of concept для новых технологий и подходов; Планирование ресурсов и координирование с Data ... engineering решений и структур данных; Разработка цепочек обработки данных с использованием сервисов Data ... TensorFlow/Keras); Опыт разработки и деплоя ML моделей в production; Глубокие знания SQL и работы с Data ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Эйлер Аналитические ТехнологииЭйлер Аналитические Технологии
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.