Senior Data Scientist NLP | RND TeamLead в LegaTech

По договоренности


Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.

Наша цель — трансформировать работу юристов, бизнеса и госструктур через:

Автоматизацию анализа договоров и юридических документов

Интеллектуальную генерацию правовых текстов

Разработку специализированных юридических чат-ботов

Создание автономных юридических ИИ-агентов

Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.

Обязанности

LLM-ориентированные решения :

  • проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач
  • проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск)
  • проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач
  • оптимизация производительности LLM в production (латентность, стоимость, точность).

Продакшен-инжиниринг :

  • внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты)
  • интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch)
  • проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных
  • работа с SQL/No SQL БД

Лидерство и экспертиза :

  • участие в постановке технических требований и взаимодействие с бизнес-заказчиками
  • проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач
  • проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM
  • менторство младших коллег, code review, разработка best practices для команды
  • анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью
  • возможно лидирование RND команды проекта и позиция TeamLead.

Требования

  • высшее образование
  • опыт работы от 5 лет в DS/NLP, включая от 1 года работы с LLM, опыт с production.
  • готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны
  • глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering
  • опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM
  • знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex)
  • уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы
  • понимание MLOps: CI/CD, мониторинг дрифта данных, логирование
  • опыт трансформации бизнес-задач в технические требования
  • умение оценивать ROI DS-решений и балансировать между инновациями и практичностью
  • умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью.

Условия

  • комфортный современный офис
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована день назад

Похожие вакансии

Мы в поиске специалиста по Data Science, который будет внедрять современные ML и AI решений в различные ... Data-driven подход к разработке Разработка и внедрение AI-агентов на базе LLM (SOTA open-source решения ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Страховая компания Сбербанк страхованиеСтраховая компания Сбербанк страхование
  • Москва
16 дней назад
Наш стэк: Python, Dagster, Starlette, Aiohttp, GraphQL, REST, Docker, Kafka, SQL, S3, Redis, Clickhouse, SQLAlchemy, PostgreSQL, FastAPI. Классы задач, которые необходимо будет выполнять: Настройка инфраструктуры обучения моделей; Оптимизация парамет...
  • Полный день
  • Опыт от 5 лет
Логотип компании NavioNavio
  • Москва
12 дней назад
Ищем Senior Data Scientist для развития рекламных технологий Ozon Банка.
  • Полный день
  • Опыт от 5 лет
Логотип компании OzonOzon
  • Москва
15 дней назад
X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и «Чижик», а также цифровыми сервисами «Vprok.ru Перекрёсток», 5Post, «Много Лосося» и медиаплатформой Food.ru. X5 Tech - IT-компа...
  • Полный день
  • Опыт от 5 лет
Логотип компании X5 TechX5 Tech
  • Москва
14 дней назад
280 000 - 300 000 ₽
Часто применяем подходы BigData, Data Science, актуальные подходы к программному анализу данных и прогнозированию ...
  • Полный день
  • Опыт от 5 лет
Логотип компании LIANLIAN
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.