Middle NLP Data Scientist (команда AI phygital)
По договоренности
Мы разрабатываем AI-помощников для автоматизации поддержки клиентов Экосистемы Сбера (ОККО, Самокат, ЕАптека). Наши решения на основе ML и LLM самостоятельно обрабатывают вопросы, сокращая нагрузку на операторов и обслуживая до 6 млн обращений в месяц. В составе команды вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в высоконагруженный продакшен. Мы ищем NLP Data Scientist’а для разработки и улучшения решений с упором на работу с LLM-моделями, прежде всего GigaChat.
Обязанности
- Разработка и внедрение LLM моделей для решения NLU задач бизнеса (SFT, RAG (Retrieval Augmented Generation), Agents, Summarization, Text Ranking, Text Matching, Language Modeling)
- Дообучение LLM моделей
- Разработка подходов и процессов разметки данных для оценки качества работы LLM
- Формирование и работа с ML пайплайнами: работа с данными, обучение/дообучение NLP моделей, оценка качества решений, поддержка/автоматизация решений
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Работа с командой бизнес-представителей, DS-разработчиками
- Организация проверки и генерация гипотез для решения технических и бизнес-задач.
Требования
- Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Опыт работы с Pytorch для построения DL текстовых моделей
- Опыт работы с библиотеками LangChain/LangGraph
- Опыт практической работы с LLM через API
- Отличные теоретические знания классического и нейросетевого NLP, в тч LLM
- Опыт дообучения классических трансформеров и LLM
- Практический опыт, эксперименты, внедрение в ПРОД LLM решений
- Опыт prompt-engineering
- Знание sql
- Linux, Git.
Будет плюсом:
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт постановки и проведения a/b тестов
- Опыт работы с распределенным обучением, глубокое знание GPU архитектуры.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - возможен гибрид после испытательного срока
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 21 день назад
Похожие вакансии
Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить карту... образование в области математики, статистики, информатики или смежных областях Опыт работы в области Data ...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
Ищем Senior Data Scientist в команду Центра управления наличным денежным обращением (ЦУНДО) для ведения ... Требования опыт работы data scientist’ом от года высшее образование в областях математики, Computer Science ... или Data analytics знание методов математической статистики, алгоритмов анализа данных (регрессионный ...
- Полный день
- Опыт от 1 года
- Москва
5 дней назад
Мы ищем Data Scientist’a для работы с моделями последовательностей событий (Transformer, LSTM, RNN) и ... контрагентов – методологи, DE, бизнес пользователи Требования Отличные знания в области классического data ...
- Полный день
- Опыт от 1 года
- Москва
2 дня назад
... моделей Хорошая математическая база и знание классических ML-алгоритмов Профильное образование в сфере Data ...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
Наша команда занимается внедрением нейронных сетей в бизнес-процессы банка. Мы строим не только SOTA алгоритмы, но и активно «приземляем» наши исследования, растим бизнес и клиентский опыт, исследуем новые источники данных и подходы к моделированию н...
- Полный день
- Опыт от 1 года
- Москва
3 дня назад
Наша команда занимается оценкой и управлением модельным риском. Модельный риск возникает вследствие решений, которые основаны на неверных или неправильно интерпретируемых моделях, что приводит к финансовым и репутационным потерям. Мы валидируем все м...
- Полный день
- Опыт от 1 года
- Москва
3 дня назад