Senior Data Scientist NLP | RND TeamLead в LegaTech

По договоренности


Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.

Наша цель — трансформировать работу юристов, бизнеса и госструктур через:

Автоматизацию анализа договоров и юридических документов

Интеллектуальную генерацию правовых текстов

Разработку специализированных юридических чат-ботов

Создание автономных юридических ИИ-агентов

Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.

Обязанности

LLM-ориентированные решения :

Проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач.

Проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск).

Проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач

Оптимизация производительности LLM в production (латентность, стоимость, точность).

Продакшен-инжиниринг :

Внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты).

Интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch).

Проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных.

Работа с SQL/No SQL БД

Лидерство и экспертиза :

Участие в постановке технических требований и взаимодействие с бизнес-заказчиками.

Проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач

Проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM

Менторство младших коллег, code review, разработка best practices для команды.

Анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью.

Возможно лидирование RND команды проекта и позиция TeamLead

Требования

Опыт : 3+ лет в DS/NLP, включая 1+ год работы с LLM, опыт с production.

Технические навыки :

Готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны.

Глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering.

Опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM.

Знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex).

Уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы.

Понимание MLOps: CI/CD, мониторинг дрифта данных, логирование.

Бизнес-ориентированность :

Опыт трансформации бизнес-задач в технические требования.

Умение оценивать ROI DS-решений и балансировать между инновациями и практичностью.

Умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью.

Soft Skills :

Умение аргументировать технические решения перед заказчиками.

Опыт управления мини-проектами и координации команд.

Умение коммуницировать с заказчиками и экспертами в различных доменных областях.

Условия

Мы готовы предложить:

  • комфортный современный офис
  • возможность выбрать удобный график – офис/гибрид
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 4 часа назад

Похожие вакансии

Кого мы ищем: Senior специалиста, который сможет взять на себя контроль работы 3-х DS на низком уровне ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
4 часа назад
Основные задачи: Работа с данными (очистка данных, исследование, feature engineering) Выдвижение и проверка гипотез Обсуждение задачи с бизнес заказчиками Разработка прогнозных моделей машинного обучения на основе табличных данных (прогноз продаж, пр...
  • Полный день
  • Опыт от 3 лет
Логотип компании Вкусно — и точкаВкусно — и точка
  • Москва
7 дней назад
Мы, команда в Unit Data B2C, разрабатываем внутреннее веб-приложение для создания и управления клиентскими ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
от 350 000 ₽
Выше средней на 66%
Ищем (Senior) Data Scientist, который возьмёт на себя ключевую роль в развитии скоринговых и риск-моделей ... / churn / cross-sell модели Взаимодействовать с бизнесом, рисками, IT — переводить бизнес-задачи в data-решения ... менее опытных DS/аналитиков, участвовать в code review и выборе подходов Наши ожидания 3+ лет опыта в Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании МКК ДеньгиОКМКК ДеньгиОК
  • Москва
2 дня назад
Команда Intelligent Search, создаем поисковый сервис, который отвечает на запросы пользователей на естественном языке. Миссия команды: Сломать барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Мы предоставляем GigaChat до...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
8 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.