Senior Data Scientist (LLM)

По договоренности

  • Крылатское
  • Мнёвники

Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda.
Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо этого мы активно развиваем применения LLM в различных задачах Lamoda от клиентских продуктов до поддержки и умного поиска по внутренним системам.

Чем предстоит заниматься:

  • Обучение LLM-стилиста, разбирающегося в моде и стиле, который способен поддерживать диалог, давать советы и помогать в навигации по товарам на Lamoda
  • Проведение полного цикла дообучения LLM: Continual pretraining, SFT, Preference Optimization этапы
  • Развитие RAG пайпланов: полнотекстовый, семантический и гибридный поиск документов в базе знаний
  • Разработка retrieval алгоритмов в различных задачах: визуальный поиск, поиск релеватного документа, поиск подходящего товара/образа
  • Выстраивание связи между LLM-стилистом и моделями генерации образов (комлектов товаров)
  • Разработка внутренних бенчмарков для оценки языковых моделей, включая llm as judge подходы

Мы ожидаем:

  • Опыт работы в ML от 5 лет, в Deep Learning от 3 лет
  • Владение Python и умение писать сложные SQL-запросы, опыт работы с Hadoop, Spark, Airflow, Docker
  • Опыт дообучения LLM, построения агентских систем / RAG-пайплайнов
  • Опыт вывода ML-моделей в прод для решения бизнес-задач
  • Знания математической статистики, теории вероятности, алгоритмов и структур данных

Стэк технологий: Python, PyTorch, Big data (Hadoop, PySpark, Hive), Airflow, Docker, SQL.

Почему у нас классно:

  • Мы аккредитованная IT-компания
  • Есть возможность работать по "гибриду" из Москвы, либо удалённо из любой точки
  • Всё необходимое железо для работы: мощные ресерч-сервера с GPU и большой Hadoop-кластер
  • Зрелый сетап разработки ML-решений полного цикла: современный стек, высокий уровень культуры разработки, более 50 ML-моделей в проде, есть команда MLOps
  • Полный жизненный цикл разработки data-driven продуктов с применением ML - от генерации идеи и до подведения результатов АБ-теста
  • Проекты НЕ в стол, более 95% инициатив доходят до A/b теста/прода (можно видеть результаты своей работы буквально с первого квартала; хороший time-to-market)
  • Культура code review и принятия решений на основании данных
  • Сильные кросс-функциональные команды middle и senior специалистов, развитое DS-сообщество, любим обмениваться знаниями на внутренних шерингах и митапах
  • Можно и нужно предлагать свои идеи; каждый может влиять на то, что делается в рамках его команды или всего DS-отдела/продукта
  • Персональные карьерные маршруты для каждого члена DS команды
  • Минимум бюрократии, доступы за 1-2 дня

Адрес: Россия, Москва, Крылатская улица, 15
Показать на большой карте

Поделиться:

Опубликована 7 часов назад

Похожие вакансии

Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform), который поможет ... Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL. ... Почему у нас классно: Полный жизненный цикл разработки data-driven продуктов с применением ML - от генерации ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
7 часов назад
... Data Scientist (RAG Systems) — Middle+ / Senior Направление: LLM / NLP / Information Retrieval Формат ... Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу • Строить data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Трейдмарк холдерТрейдмарк холдер
  • Москва
день назад
250 000 - 350 000 ₽
Выше средней на 20%
Аккредитованная компания “АЦТС”, являющаяся дочерней IT структурой «Про.Потолок», приглашает в команду опытного Senior ... ML Engineer / Data Scientist (Computer Vision & NLP) для работы над масштабными и технологически ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Про.ПотолокПро.Потолок
  • Москва
3 дня назад
Полный цикл: от анализа данных, до внедрения моделей/правил и мониторинга их работы Глубокий exploratory data ... для анализа данных и машинного обучения (pandas/polars, scikit-learn, xgboost, tf/torch) Опыт с big data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AdvivaAdviva
  • Москва
8 дней назад
Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату. Мы ищем п...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
2 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.