Middle/Senior Data Scientist (Классический ML)

По договоренности


Наша команда занимается созданием инструментов и решений для внутренней безопасности на базе AI. Наши планы имеют широкий спектр - начиная от Classical Machine Learning, DL-моделей для скоринга, поведенческого моделирования и заканчивая AI-агентами.

Сейчас мы ищем Middle/Senior Data Scientist с опытом в классическом ML, нейронных сетях и с желанием развиваться в DL и в других направлениях.

Обязанности

· Сбор, интеграция и предобработка данных из разнородных источников, включая обработку временных рядов, категориальных и числовых признаков.

· Проведение feature engineering с созданием высокоинформативных признаков, отражающих специфику предметной области.

· Разработка, обучение и тонкая настройка (fine-tuning) классических ML моделей: регрессия, решающие деревья, бэггинг, бустинг (XGBoost, LightGBM, CatBoost), SVM, k-NN, кластеризация.

· Разработка и оптимизация алгоритмов прогнозирования и рекомендаций, анализ временны́х данных.

· Детекция появление аномалий в данных.

· Анализ текстовых данных систем логирования для выявления закономерностей.

· Анализ и визуализация данных для выявления закономерностей и инсайтов.

· Валидация моделей с применением кросс-валидации (TimeSeriesSplit, stratified), оптимизация метрик качества (ROC AUC, F1, Precision/Recall).

· Мониторинг и поддержка продуктивных моделей, организация переобучения при дрейфе данных (Data Drift, Concept Drift).

· Внедрение автоматизированных пайплайнов обучения и оценки, интеграция моделей с продакшеном совместно с DevOps-инженерами.

· Подготовка отчетов и презентаций для технических и бизнес-стейкхолдеров, участие в планировании развития ML проектов.

· Менторство и поддержка младших специалистов.

Требования

· Глубокое понимание классических алгоритмов машинного обучения: линейная и логистическая регрессия, SVM (с разными ядрами), решающие деревья, ансамблевые методы (Random Forest, Gradient Boosting, XGBoost, LightGBM, CatBoost), k-NN, Наивный Байес, методы кластеризации (k-means, DBSCAN, GMM), методы понижения размерности (SVD, PCA, NMF).

· Решение задач по визуализации данных, результатов обучения и тестирования моделей, снижение размерности для визуализации (t-SNE, UMap).

· Опыт работы с Feature Engineering: кодирование категориальных признаков, масштабирование, создание и отбор признаков, работа с несбалансированными данными (SMOTE, ADASYN).

· Знание методов валидации моделей (k-fold cross-validation, stratified sampling), управления переобучением (регуляризация L1/L2, pruning, early stopping).

· Опыт построения пайплайнов данных на Python с использованием NumPy, Pandas, SciPy, Scikit-learn, а также автоматизации процессов обучения и оценки.

· Навыки работы с SQL и инструментами для обработки больших данных (Spark, Dask).

· Опыт использования или понимание принципов работы Hadoop / PySpark.

· Умение проводить статистический анализ, проверять гипотезы, использовать A/B тестирование.

· Опыт настройки гиперпараметров с помощью Grid Search, Random Search, Bayesian Optimization (Optuna, Hyperopt).

· Владение техникой интерпретируемости моделей: SHAP, LIME, partial dependence plots.

· Практический опыт решения бизнес-задач с помощью классических ML-моделей и понимание, когда использовать простые методы вместо сложных нейросетей.

· Решение задач с рекуррентными и сверточными нейронными сетями, трансформерами, построение бейзлайнов на основе нейронок.

· Как плюс - владение инструментами в области Deep Learning: PyTorch - понимание DataLoader, файн-тюнинг моделей.

· Навыки командной работы, координации проектов и менторства младших коллег

Используемый стек:

· Библиотеки работы с табличными данными: Numpy, Pandas

· ML, DL библиотеки: Sklearn, PyTorch, imblearn

Библиотеки визуализации: matplotlib, seaborn

Условия

  • Инновационные, амбициозные проекты и задачи, которые развивают: всегда есть возможность прокачать свои навыки в работе и профессионально расти;
  • Среда для обмена знаниями – высокая экспертиза внутри команды;
  • Сплоченная команда, работающая над общими задачами и умеющая хорошо отдыхать;
  • Нашу культуру создают сами сотрудники – мы их слышим и помогаем создавать и поддерживать корпоративные комьюнити по интересам
  • Стабильная заработная плата и годовой бонус;
  • Гибридный формат работы. Современный IT-офис вблизи Москва-Сити в пяти минутах от метро "Кутузовская", с фитнес залом;
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ;
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
  • Вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

ИТ B2C - самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее. Ждем именно тебя! Наша команда занимается с...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
Мы в поиске специалистов по Data Science уровня Middle+/Senior для совместной работы с нашими консультантами. Подразделение "Digital" в структуре "Яков и Партнёры" – это ведущие эксперты в области искусственного интеллекта, разработки инновационных ц...
  • Полный день
  • Опыт от 3 лет
Логотип компании Яков и ПартнёрыЯков и Партнёры
  • Москва
3 дня назад
Мы — аккредитованная IT-компания, осуществляющая деятельность по развитию цифровых сервисов в различных отраслях экономики. Компания входит в группу S8 и является резидентом инновационного центра «Сколково». Ищем Data Scientist / ML Engineer в Столот...
  • Полный день
  • Опыт от 3 лет
Логотип компании СинхроСинхро
  • Москва
3 дня назад
Мы ищем опытного специалиста по работе с искусственным интеллектом и машинному обучению, готовых решать амбициозные задачи в сфере HR-технологий Сбербанка. Если ты хочешь создавать инновационные продукты и сервисы, влияющие на развитие сотрудников кр...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
6 дней назад
РТЛабс создаёт и развивает масштабные цифровые сервисы Госуслуг — портал, мобильные приложения, социально значимые услуги, системы электронного правительства. Наша команда делает жизнь миллионов пользователей проще и позволяет решать жизненные вопрос...
  • Полный день
  • Опыт от 3 лет
Логотип компании РТЛабсРТЛабс
  • Москва
3 дня назад
Мы приглашаем в нашу команду талантливого специалиста, заинтересованного в развитии карьерных перспектив и повышении эффективности нашей деятельности. Вам предстоит заниматься разработкой и исследованием статистических и машинно-обучаемых моделей для...
  • Полный день
  • Опыт от 3 лет
Логотип компании СК Сбербанк страхование жизниСК Сбербанк страхование жизни
  • Москва
10 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.