Senior NLP Data Scientist (команда Управление знаниями)
По договоренности
Мы развиваем GenAI систему управления знаниями о продуктах и процессах B2C Сбера от создания контента, дистрибуции его по каналам (Агенты с RAG, рабочие места сотрудников) до оценки качества и формирования задач на его улучшение. На основе наших знаний происходит обслуживание более 15 млн клиентов в месяц в различных каналах. Мы ищем NLP Data Scientist’а для работы и лидирования AI-стримов в команде и непосредственной разработки и улучшения LLM-решений с упором на взаимодействие с LLM GigaChat. В составе продуктового кластера вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в ПРОМ.
Обязанности
- Разработка и внедрение LLM-приложений для решения задач управления знаниями и передачи знаний Агентам (Classification, Clustering, RAG/Agentic RAG/GraphRAG, Summarization, Text Ranking, Text Matching)
- Разработка подходов и процессов для оценки качества работы LLM и помощников редактора знаний на его основе, в т.ч. через построение проектов разметки
- Формирование и работа с ML пайплайнами
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Взаимодействие с бизнесом и системными аналитиками, разработчиками, DE и DA
- Организация проверки и генерация гипотез для решения технических и бизнес-задач.
Требования
- Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Опыт работы с Pytorch для построения DL текстовых моделей
- Опыт работы с библиотеками LangChain/LangGraph
- Опыт практической работы с LLM через API
- Опыт работы с RAG системами и глубокое понимание механики работы
- Отличные теоретические знания классического и нейросетевого NLP, в т.ч. LLM
- Опыт дообучения NLP моделей
- Практический опыт, эксперименты, внедрение в ПРОД NLP решений
- Опыт prompt-engineering
- Знание sql
- Linux, Git.
Будет плюсом:
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт работы с векторными хранилищами (OpenSearch, pgvector PostgreSQL)
- Опыт постановки и проведения A/B тестов
- Опыт работы с распределенным обучением, глубокое знание GPU архитектуры.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - возможен гибрид после испытательного срока
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 8 часов назад
Похожие вакансии
В связи с активным развитием проектов в компании открыта вакансия Data Scientist.
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Ищем коллегу в команду разработки AI-агентов Департамента Инфраструктрных решений для построения мультиагентной системы оптимизации инфраструктуры. В рамках проекта предполагается построение ряда Classic-ML моделей и LLM-приложений, чей эффект напрям...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Мы в поиске специалистов по Data Science уровня Middle+/Senior для совместной работы с нашими консультантами ...
- Полный день
- Опыт от 3 лет
- Москва
8 часов назад
Ищем Senior Data Scientist в команду Центра управления наличным денежным обращением (ЦУНДО) для ведения ... Требования высшее образование в областях математики, Computer Science или Data analytics знание методов ...
- Полный день
- Опыт от 3 лет
- Москва
8 часов назад
Ищем Senior Data Scientist для разработки и масштабирования AI-продуктов с измеримым бизнес-эффектом ...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
... крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках Data ... Scientist. ... Ожидания от кандидата: Опыт работы Data Scientist от 3,5 лет+; Отличные знания Python и SQL; Понимание ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад