Data scientist Middle+

По договоренности


В продуктовую команду внедрения и развития искусственного интеллекта в сфере EdTech в СБЕРе ищем выдающегося Data Scientist/ML Engineer.

Тебе предстоит заниматься разработкой ML-пайплайнов и AI-систем с использованием передовых технологий AI: NLP, LLM, MLLM, RAG, AI-агентов и мультиагентных систем в частности на базе флагманской модели СБЕРа – GigaChat.

Твоей главной целью в команде с дата-аналитиками и промпт-инженерами и разработчиками будет создание production-систем, способных обрабатывать большие объемы данных разных модальностей и выдавать результаты, нацеленные на эффективное решение бизнес-задач.

У тебя есть уникальный шанс принять участие в формировании передовых AI native EdTech решений в команде сильных и амбициозных профессионалов, нацеленных на результат.

Обязанности

  • Оперативная проверка гипотез (Proof of Concept): предобработка данных, подбор, тестирование и дообучение моделей и функционала (например, function calling), подсчет и улучшение метрик, необходимых для решения бизнес-задачи, EDA;
  • Участие в подготовке тестовых и валидационных датасетов, разработка требований к данным, их формату, качеству, структуре, объему, проработка соответствующих методологий разметки, необходимых для качественной отработки AI-систем;
  • Разработка, внедрение, мониторинг и оптимизация ML-пайплайнов и AI-систем, в частности RAG (LLM, cross-encoder, модели ранжирования и т. п.) в том числе для данных разных модальностей (текстов, видео, аудио);
  • Совместно с командой анализ функциональных требований, дизайн решения, проектирование оптимальной функциональной архитектуры реализации;
  • Участие в проработке оптимальных интеграционных сценариев с источниками данных (в том числе разных форматов и модальностей) совместно со смежными командами, отстройка оптимальных ETL-процессов с учетом бизнес-требований.

Требования

  • Знания Python и библиотек для работы с данными (pandas, numpy, matplotlib, seaborn, pytorch, sklearn, BeautifulSoup и пр.)
  • Знания классических и современных методов работы с текстовыми данными: токенизация, стемминг, лематизация, NER, sentiment analysis, кластеризация, TF-IDF, embeddings; трансформеры (BERT и пр.), LLM, MLLM, и пр.
  • Понимание принципов работы моделей в области распознавания и синтеза речи и генерации изображений;
  • Построение LLM-, RAG-пайплайнов, агентных и мультиагентных систем с применением соответствующих инструментов: LangСhain, GigaChain, LangGraph, function calling, векторные БД, ETL, и пр. Отслеживание тенденций и нововведений, оперативное тестирование новых инструментов для решения прикладных бизнес-задач;
  • Понимание принципов MLOps, участие в процессах выкатки и поддержки разработанных AI-решений в production-среде;
  • Опыт/понимание работы с технологиями: Docker, fastAPI, gRPC, REST и пр.
  • Инструментальное владение AI для анализа, генерации и автоматизации.

Будет плюсом:

  • Понимание тонкостей промпт-инжиниринга и соответствующий опыт;
  • Опыт работы/знание Java;
  • Понимание принципов работы классического ML, рекомендательных систем, CV.

Условия

  • Гибридный формат работы (современный офис в Москве на Кутузовском проспекте);
  • Льготные ипотечные условия кредитования;
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров: Okko, Сбер Маркет, Мега Маркет, Самокат, Еаптека и другие;
  • ДМС с первого дня и скидки на страхование для близких;
  • Корпоративная пенсионная программа;
  • Детский отдых и подарки за счет Компании;
  • Обучение за счет Компании: онлайн курсы, неограниченный доступ к библиотеке и обучение на базе Корпоративного университета тренинги, митапы и возможность получить новую квалификацию;

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

... образование в области математики, статистики, информатики или смежных областях Опыт работы в области Data ...
  • Полный день
  • Опыт от 1 года
Логотип компании Лига Цифровой ЭкономикиЛига Цифровой Экономики
  • Москва
4 дня назад
Ключевые задачи: - Разработка моделей компонентов кредитного риска (PD, EAD, LGD) для корпоративных клиентов и финансовых институтов; - Разработка моделей стресс-тестирования корпоративного портфеля; - Мониторинг и совершенствование разработанных мод...
  • Полный день
  • Опыт от 1 года
Логотип компании Банк ПСББанк ПСБ
  • Москва
день назад
Мы – быстроразвивающаяся и очень дружная команда, которая занимается обеспечением безопасности данных в группе компаний Сбер. В частности, сканированием баз данных на наличие персональных данных с применением комбинированного подхода из ML-моделей и ...
  • Полный день
  • Опыт от 1 года
Логотип компании SberTechSberTech
  • Москва
4 дня назад
... моделей Хорошая математическая база и знание классических ML-алгоритмов Профильное образование в сфере Data ...
  • Полный день
  • Опыт от 1 года
Логотип компании Р-ВижнР-Вижн
  • Москва
4 дня назад
Ищем Data scientist , который готов строить, улучшать и применять marketing mix модели в крупнейшем банке ...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
день назад
Ищем Senior Data Scientist в команду Центра управления наличным денежным обращением (ЦУНДО) для ведения ... Требования опыт работы data scientist’ом от года высшее образование в областях математики, Computer Science ... или Data analytics знание методов математической статистики, алгоритмов анализа данных (регрессионный ...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.