Senior Data Scientist (LLM)
По договоренности
- Крылатское
- Мнёвники
Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda.
Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо этого мы активно развиваем применения LLM в различных задачах Lamoda от клиентских продуктов до поддержки и умного поиска по внутренним системам.
Чем предстоит заниматься:
- Обучение LLM-стилиста, разбирающегося в моде и стиле, который способен поддерживать диалог, давать советы и помогать в навигации по товарам на Lamoda
- Проведение полного цикла дообучения LLM: Continual pretraining, SFT, Preference Optimization этапы
- Развитие RAG пайпланов: полнотекстовый, семантический и гибридный поиск документов в базе знаний
- Разработка retrieval алгоритмов в различных задачах: визуальный поиск, поиск релеватного документа, поиск подходящего товара/образа
- Выстраивание связи между LLM-стилистом и моделями генерации образов (комлектов товаров)
- Разработка внутренних бенчмарков для оценки языковых моделей, включая llm as judge подходы
Мы ожидаем:
- Опыт работы в ML от 5 лет, в Deep Learning от 3 лет
- Владение Python и умение писать сложные SQL-запросы, опыт работы с Hadoop, Spark, Airflow, Docker
- Опыт дообучения LLM, построения агентских систем / RAG-пайплайнов
- Опыт вывода ML-моделей в прод для решения бизнес-задач
- Знания математической статистики, теории вероятности, алгоритмов и структур данных
Стэк технологий: Python, PyTorch, Big data (Hadoop, PySpark, Hive), Airflow, Docker, SQL.
Почему у нас классно:
- Мы аккредитованная IT-компания
- Есть возможность работать по "гибриду" из Москвы, либо удалённо из любой точки
- Всё необходимое железо для работы: мощные ресерч-сервера с GPU и большой Hadoop-кластер
- Зрелый сетап разработки ML-решений полного цикла: современный стек, высокий уровень культуры разработки, более 50 ML-моделей в проде, есть команда MLOps
- Полный жизненный цикл разработки data-driven продуктов с применением ML - от генерации идеи и до подведения результатов АБ-теста
- Проекты НЕ в стол, более 95% инициатив доходят до A/b теста/прода (можно видеть результаты своей работы буквально с первого квартала; хороший time-to-market)
- Культура code review и принятия решений на основании данных
- Сильные кросс-функциональные команды middle и senior специалистов, развитое DS-сообщество, любим обмениваться знаниями на внутренних шерингах и митапах
- Можно и нужно предлагать свои идеи; каждый может влиять на то, что делается в рамках его команды или всего DS-отдела/продукта
- Персональные карьерные маршруты для каждого члена DS команды
- Минимум бюрократии, доступы за 1-2 дня
Адрес: Россия, Москва, Крылатская улица, 15
Опубликована 21 день назад
Похожие вакансии
300 000 - 500 000 ₽
Выше средней на 70%
Computer Vision. Разработка и оптимизация алгоритмов для распознавания и классификации патологий на КТ-снимках. О компании Нейровижн - это инновационная компания, специализирующаяся на разработке и интеграции передовых продуктов и решений в области к...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
8 часов назад
Big Data является одним из приоритетных направлений нашей компании. ... В 2017 году, в рамках компании создан новый департамент по разработке продуктов на основе Big Data.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Мы ищем Senior Data Scientist в команду SmartSearch, которая будет драйвить развитие поискового стека ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
до 350 000 ₽
Выше средней на 48%
Обязанности: • Разрабатывать ML-модели для систем рекомендаций. • Работать с полным ML-пайплайном — от данных и фичей до продакшн-инференса. • Взаимодействовать с backend-инженерами, участвовать в проектировании инфраструктуры и A/B-тестировании моде...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Сейчас мы ищем Senior Data Scientist для разработки системы рекомендаций и увеличения средней корзины ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
... бизнес-доменов подразделения: целеполагание и эффективность деятельности, управление численностью Группы, Data-driven ... Обязанности Обязанности участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data ... ML-моделей, доведение моделей из стадии MVP до целевого решения (все этапы ЖЦ моделей по CRISP-DM от Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Вакансия в подборках
Похожие вакансии
300 000 - 500 000 ₽
до 350 000 ₽