Middle NLP Data Scientist (команда AI phygital)
По договоренности
Мы разрабатываем AI-помощников для автоматизации поддержки клиентов Экосистемы Сбера (ОККО, Самокат, ЕАптека). Наши решения на основе ML и LLM самостоятельно обрабатывают вопросы, сокращая нагрузку на операторов и обслуживая до 6 млн обращений в месяц. В составе команды вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в высоконагруженный продакшен. Мы ищем NLP Data Scientist’а для разработки и улучшения решений с упором на работу с LLM-моделями, прежде всего GigaChat.
Обязанности
- Разработка и внедрение LLM моделей для решения NLU задач бизнеса (SFT, RAG (Retrieval Augmented Generation), Agents, Summarization, Text Ranking, Text Matching, Language Modeling)
- Дообучение LLM моделей
- Разработка подходов и процессов разметки данных для оценки качества работы LLM
- Формирование и работа с ML пайплайнами: работа с данными, обучение/дообучение NLP моделей, оценка качества решений, поддержка/автоматизация решений
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Работа с командой бизнес-представителей, DS-разработчиками
- Организация проверки и генерация гипотез для решения технических и бизнес-задач.
Требования
- Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Опыт работы с Pytorch для построения DL текстовых моделей
- Опыт работы с библиотеками LangChain/LangGraph
- Опыт практической работы с LLM через API
- Отличные теоретические знания классического и нейросетевого NLP, в тч LLM
- Опыт дообучения классических трансформеров и LLM
- Практический опыт, эксперименты, внедрение в ПРОД LLM решений
- Опыт prompt-engineering
- Знание sql
- Linux, Git.
Будет плюсом:
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт постановки и проведения a/b тестов
- Опыт работы с распределенным обучением, глубокое знание GPU архитектуры.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - возможен гибрид после испытательного срока
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 9 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX ... переобучения моделей в Airflow - Работа с потоковыми данными в Kafka Мониторинг: - Настройка мониторинга data ... MLflow (трекинг), Docker/K8s (контейнеризация) - Опыт использования систем контроля версий Git/Bitbucket Data ... - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data ...
- Полный день
- Опыт от 1 года
- Москва
9 часов назад
Ищем Data scientist , который готов строить, улучшать и применять marketing mix модели в крупнейшем банке ...
- Полный день
- Опыт от 1 года
- Москва
9 часов назад
Обязанности Data Mining: - Поиск инсайтов и закономерностей в огромных массивах неструктурированной информации ... MLflow (трекинг), Docker/K8s (контейнеризация) - Опыт использования систем контроля версий Git/Bitbucket Data ... - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data ...
- Полный день
- Опыт от 1 года
- Москва
9 часов назад
В Центр портфельного риск-моделирования ищем коллегу. Вы будете работать в большой и организованной команде профессионалов и разрабатывать модели с существенным эффектом на PL Банка. Получите уникальный шанс погрузиться в розничные кредитные процессы...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
Ищем «Data Scientist (Аналитика данных)» в проект ID Collect.
- Частичная занятость
- Опыт от 1 года
- Москва
7 дней назад