Senior Data Scientist
По договоренности
Мы строим высоконагруженные production-grade ML-системы для обеспечения банковской безопасности. Наш фокус: антифрод, управление рисками, обнаружение аномалий и оптимизация бизнес-процессов. Внедряем различные решения – от классического ML до state-of-the-art архитектур в DL.
Ищем опытного Fullstack DS c мультидоменной экспертизой, готового взять на себя полный цикл (E2E): от постановки задачи и сбора данных до деплоя в прод и настройки мониторинга.
Обязанности
- Самостоятельный поиск и подготовка данных в витринах, работа со стримингами и ETL
Исследования и валидация:
- Проведение экспериментов с версионированием и валидацией метрик
- Глубокая аналитика метрик
Мультидоменность:
- Разработка и обучение моделей в нескольких доменах. От обучения классификатора транзакций (Classic ML) и LLM-агента для разбора логов до Audio модели для транкрибации речи
E2E разработка:
- Проектирование и деплой маштабируемых ML-пайплайнов: от копания в сырых данных и генерации фичей до деплоя микросервиса, который не «ложится» под нагрузкой
Reporting:
- Построение сложных аналитических схем и визуализация метрик
Ифраструктура и интеграция:
- Совместная работа DevOps/Backend по интеграции моделей в микросервисную архитектуру
Лидерство:
- Участие в найме новых сотрудников
- Менторство джунов
- Взаимодействие с бизнес-заказчиками
Требования
Опыт работы DS от 5-и лет (с подтверждённым опытом вывода моделей в прод)
- Хорошие знания математической статистики и теории вероятности
- Понимание алгоритмов и структур данных (CS)
- Мультидоменная экспертиза: практический опыт минимум в 2-х доменах (CV, NLP/LLM, TS, RL, RS, Audio)
- Глубокое понимание PyTorch (кастомные архитектуры)
- Понимание архитектуры трансформеров и графовых алгоритмов
Инженерная база:
- Свободное владение Python (чистый код, знание numpy/pandas/scikit-learn)
- Понимание микросервисной архитектуры и работы с очередями (Kafka)
- Опыт написания асинхронных сервисов взаимодействия с ML-моделями (asyncio/aiohttp)
MLOps-инструментарий:
- Опыт с Airflow (оркестрация), MLflow (трекинг), Docker/K8s (контейнеризация)
- Опыт использования систем контроля версий Git/Bitbucket
Data & Infra:
- Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data стеком (Spark, Hadoop)
- Умение решить любую несложную инфраструктурную задачу, с которой не работал(а) ранее
Будет плюсом:
- Опыт с LLMs (fine-tuning, RAG, evaluation via RAGAS/DeepEval, vLLM).
- Глубокая экспертиза в узком домене из списка
- Уверенный опыт с LangChain, LangGraph, function calling
- Законченный ШАД/ OZON Masters/ AI Masters
Условия
- Инновационные, амбициозные проекты и задачи, которые развивают: всегда есть возможность прокачать свои навыки в работе и профессионально расти;
- Среда для обмена знаниями – высокая экспертиза внутри команды;
- Сплоченная команда, работающая над общими задачами и умеющая хорошо отдыхать;
- Нашу культуру создают сами сотрудники – мы их слышим и помогаем создавать и поддерживать корпоративные комьюнити по интересам
- Стабильная заработная плата и годовой бонус;
- Полностью офисный формат работы. Современный IT-офис вблизи Москва-Сити в пяти минутах от метро "Кутузовская", с фитнес залом;
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ;
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 3 дня назад
Похожие вакансии
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва