Senior NLP Data Scientist (команда Управление знаниями)
По договоренности
Мы развиваем GenAI систему управления знаниями о продуктах и процессах B2C Сбера от создания контента, дистрибуции его по каналам (Агенты с RAG, рабочие места сотрудников) до оценки качества и формирования задач на его улучшение. На основе наших знаний происходит обслуживание более 15 млн клиентов в месяц в различных каналах. Мы ищем NLP Data Scientist’а для работы и лидирования AI-стримов в команде и непосредственной разработки и улучшения LLM-решений с упором на взаимодействие с LLM GigaChat. В составе продуктового кластера вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в ПРОМ.
Обязанности
- Разработка и внедрение LLM-приложений для решения задач управления знаниями и передачи знаний Агентам (Classification, Clustering, RAG/Agentic RAG/GraphRAG, Summarization, Text Ranking, Text Matching)
- Разработка подходов и процессов для оценки качества работы LLM и помощников редактора знаний на его основе, в т.ч. через построение проектов разметки
- Формирование и работа с ML пайплайнами
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Взаимодействие с бизнесом и системными аналитиками, разработчиками, DE и DA
- Организация проверки и генерация гипотез для решения технических и бизнес-задач.
Требования
- Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Опыт работы с Pytorch для построения DL текстовых моделей
- Опыт работы с библиотеками LangChain/LangGraph
- Опыт практической работы с LLM через API
- Опыт работы с RAG системами и глубокое понимание механики работы
- Отличные теоретические знания классического и нейросетевого NLP, в т.ч. LLM
- Опыт дообучения NLP моделей
- Практический опыт, эксперименты, внедрение в ПРОД NLP решений
- Опыт prompt-engineering
- Знание sql
- Linux, Git.
Будет плюсом:
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт работы с векторными хранилищами (OpenSearch, pgvector PostgreSQL)
- Опыт постановки и проведения A/B тестов
- Опыт работы с распределенным обучением, глубокое знание GPU архитектуры.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - возможен гибрид после испытательного срока
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 21 день назад
Похожие вакансии
MLflow (трекинг), Docker/K8s (контейнеризация) - Опыт использования систем контроля версий Git/Bitbucket Data ... - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data ...
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Мы находимся в поиске Data Scientist уровня Middle+/Senior для обработки Аудиоданных, который будет совершенствовать ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
... прогнозов; Проектирование аналитических витрин данных; участие во внедрении AI-моделей; взаимодействие с data-инженерами ...
- Полный день
- Опыт от 3 лет
- Москва
10 дней назад
Приглашаем опытного Data Scientist для внедрения AI-агентов, которые взаимодействует с юридическими лицами ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Привет! Мы РегионКонсалт - меняем рынок взыскания с помощью технологий. Если тебе нравится находить закономерности в данных, строить математические и ML-модели и видеть, как твой код напрямую влияет на бизнес — нам по пути. О нас Мы не просто коллект...
- Полный день
- Опыт от 3 лет
- Москва
11 дней назад
Баумана приглашает на работу Data Scientist (NLP/ LLM). ... ожидаем от Вас: Высшее техническое образование в области ИТ и /или повышение квалификации в области Data ...
- Полный день
- Опыт от 3 лет
- Москва
9 дней назад