Senior NLP Data Scientist (команда AI Phygital)
По договоренности
Мы разрабатываем AI-помощников для автоматизации поддержки клиентов Сбербанка в каналах чата. Наши решения на основе ML и LLM самостоятельно обрабатывают вопросы, сокращая нагрузку на операторов и обслуживая до 50+ млн клиентов в месяц. В составе команды вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в высоконагруженный продакшен. Мы ищем NLP Data Scientist’а для разработки и улучшения решений с упором на работу с LLM-моделями, прежде всего GigaChat.
Обязанности
- Разработка и внедрение LLM моделей для решения NLU задач бизнеса (SFT, RAG (Retrieval Augmented Generation), Agents, Summarization, Text Ranking, Text Matching, Language Modeling)
- Дообучение LLM моделей
- Разработка подходов и процессов разметки данных для оценки качества работы LLM
- Формирование и работа с ML пайплайнами: работа с данными, обучение/дообучение NLP моделей, оценка качества решений, поддержка/автоматизация решений
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Работа с командой бизнес-представителей, DS-разработчиками
- Организация проверки и генерация гипотез для решения технических и бизнес-задач.
Требования
- Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Опыт работы с Pytorch для построения DL текстовых моделей
- Опыт работы с библиотеками LangChain/LangGraph
- Опыт практической работы с LLM через API
- Отличные теоретические знания классического и нейросетевого NLP, в тч LLM
- Опыт дообучения классических трансформеров и LLM
- Практический опыт, эксперименты, внедрение в ПРОД LLM решений
- Опыт prompt-engineering
- Знание sql
- Linux, Git.
Будет плюсом:
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт постановки и проведения a/b тестов
- Опыт работы с распределенным обучением, глубокое знание GPU архитектуры.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - возможен гибрид после испытательного срока
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 10 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Мы — операционный центр одного из крупнейших банков России. Каждый день через нас проходят миллионы задач: от клиентских обращений до внутренних банковских процессов. За этим стоят тысячи сотрудников, сложная логистика распределения нагрузки и ответс...
- Полный день
- Опыт от 3 лет
- Москва
10 часов назад
Для работы над этими и другими задачами мы ищем Моделиста Data Science Дирекции оценки кредитных рисков ...
- Полный день
- Опыт от 3 лет
- Москва
10 часов назад
... области математики, статистики, информатики, физики, экономики или смежных дисциплин; Опыт работы в роли Data ... Scientist / аналитика данных от 3-х лет; Глубокое знание математической статистики, теории вероятностей ...
- Полный день
- Опыт от 3 лет
- Москва
11 часов назад
Основные задачи: Работа с данными (очистка данных, исследование, feature engineering) Выдвижение и проверка гипотез Обсуждение задачи с бизнес заказчиками Разработка прогнозных моделей машинного обучения на основе табличных данных (прогноз продаж, пр...
- Полный день
- Опыт от 3 лет
- Москва
10 часов назад
Обязанности Data Engineering: - Самостоятельный поиск и подготовка данных в витринах, работа со стримингами ... MLflow (трекинг), Docker/K8s (контейнеризация) - Опыт использования систем контроля версий Git/Bitbucket Data ... - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data ...
- Полный день
- Опыт от 3 лет
- Москва
10 часов назад
Мы находимся в поиске Data Scientist уровня Middle+/Senior для обработки Аудиоданных, который будет совершенствовать ...
- Полный день
- Опыт от 3 лет
- Москва
9 часов назад