Data Scientist (NLP|LLM)

По договоренности

  • Автозаводская
  • Технопарк
  • Коломенская

СберЗдоровье - аккредитованная IT-компания, крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины.

Сервис начал свою работу в 2012 году под брендом DocDoc. Мы помогли миллионам людей получить помощь и продолжаем повышать качество медицинских услуг.

Об IT в цифрах:

3 бизнес-направления;

20+ команд;

380+ IT специалистов (devops, AQA, web/mobile devs, backend devs, аналитики, архитекторы и др.) из 40+ городов.

Чтобы эти цифры стали выше, а наши пользователи — счастливей, мы ищем NLP|LLM Data Scientist в команду медицинского AI

Что будешь делать?

  • Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
  • Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
  • Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
  • Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
  • Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Необходимые технические навыки:

  • 3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
  • Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
  • Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.
  • Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
  • Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.

Будет плюсом

  • Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.
  • Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation.
  • Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.
  • Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.

Что мы можем предложить:

  • Сильную команду профессионалов, увлеченных своим делом;
  • Возможность развития в команде ведущей MedTech-компании России;

  • Уютный офис в Сити с панорамным видом на город, гибридный формат работы;

  • Корпоративную технику;

  • Медицинскую программу, включающую телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики;
  • Оплачиваемые курсы английского языка;
  • Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента);
  • СберУниверситет и оплату профильного обучения и курсов.

Адрес: Россия, Москва, проспект Андропова, 10
Показать на большой карте

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

до 100 000 ₽
IT-компания Selecty в активном поиске Data Scientist разработчика на крупный банковский проект.
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании SelectySelecty
  • Москва
день назад
ДЛЯ НАС ЦЕННО: Опыт работы в Data Science от 3-х лет; Уверенное владение Python и SQL (написание чистого ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
  • Москва
10 часов назад
Мы ищем Junior/Middle Data Scientist в дружную и высокопрофессиональную команду Business Data Science ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании OkkamOkkam
  • Москва
10 часов назад
Находимся в поиске Data Scientist NLP Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс ... Нам важны: - Опыт работы в роли Data scientist от 2 лет; - Работа с одним из фреймворков PyTorch/TensorFlow ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
  • Москва
9 часов назад
Привет! Меня зовут Дан, я CPO, и несколько лет назад мы с друзьями создали продукт, который помогает селлерам на маркетплейсах автоматизировать работу с отзывами, аналитикой всего рынка, чатами. Мы собираем отзывы с разных площадок, наша нейросетка о...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании СпиксСпикс
  • Москва
8 дней назад
Ищем аналитика / data scientist'а в команду операций, который займётся двумя ключевыми задачами: оптимизацией ... Наш кандидат: Имеет опыт работы аналитиком или data scientist'ом от 1 года; Уверенно пишет на SQL (ClickHouse ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ВкусВиллВкусВилл
  • Москва
6 дней назад

Похожие вакансии

до 100 000 ₽
Логотип компании SelectySelecty
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.