Senior NLP Data Scientist (команда AI Phygital)
По договоренности
Мы разрабатываем AI-помощников для автоматизации поддержки клиентов Сбербанка в каналах чата. Наши решения на основе ML и LLM самостоятельно обрабатывают вопросы, сокращая нагрузку на операторов и обслуживая до 50+ млн клиентов в месяц. В составе команды вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в высоконагруженный продакшен. Мы ищем NLP Data Scientist’а для разработки и улучшения решений с упором на работу с LLM-моделями, прежде всего GigaChat.
Обязанности
- Разработка и внедрение LLM моделей для решения NLU задач бизнеса (SFT, RAG (Retrieval Augmented Generation), Agents, Summarization, Text Ranking, Text Matching, Language Modeling)
- Дообучение LLM моделей
- Разработка подходов и процессов разметки данных для оценки качества работы LLM
- Формирование и работа с ML пайплайнами: работа с данными, обучение/дообучение NLP моделей, оценка качества решений, поддержка/автоматизация решений
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Работа с командой бизнес-представителей, DS-разработчиками
- Организация проверки и генерация гипотез для решения технических и бизнес-задач.
Требования
- Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Опыт работы с Pytorch для построения DL текстовых моделей
- Опыт работы с библиотеками LangChain/LangGraph
- Опыт практической работы с LLM через API
- Отличные теоретические знания классического и нейросетевого NLP, в тч LLM
- Опыт дообучения классических трансформеров и LLM
- Практический опыт, эксперименты, внедрение в ПРОД LLM решений
- Опыт prompt-engineering
- Знание sql
- Linux, Git.
Будет плюсом:
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт постановки и проведения a/b тестов
- Опыт работы с распределенным обучением, глубокое знание GPU архитектуры.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - возможен гибрид после испытательного срока
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована день назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAXМы ищем Data Scientist'а в команду аналитики и моделирования, где данные — это не просто отчёты, а основа ...
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов. Наша цель — трансформировать работу юристов, бизнеса и госструктур через: Автоматизацию анализа договоров и юриди...
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
Обязанности Data Engineering: - Самостоятельный поиск и подготовка данных в витринах, работа со стримингами ... MLflow (трекинг), Docker/K8s (контейнеризация) - Опыт использования систем контроля версий Git/Bitbucket Data ... - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data ...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Мы — команда Data Science департамента «Занять и сберегать» (Управление искусственного интеллекта и исследования ...
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Ищем Data Scientist Наш стек: Python, Go, S3, Spark, Hive, Airflow, MLFlow, Kafka, ClickHouse.
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
Обязанности: Работа представляет из себя непрерывный поток аналитики и разработки ML-моделей для бизнес-направления Банка по работе с корпоративными клиентами малого и микро бизнеса, что включает в себя: • Подключение на регулярные звонки по видеосвя...
- Полный день
- Опыт от 3 лет
- Москва
день назад