Senior Data Scientist

По договоренности


В SberData мы создаем централизованное хранилище данных. Сбер сегодня обладает одним из крупнейших в стране хранилищ данных - объем данных банка превысил 250 ПБ. За секунду с нашими данными совершается около 500 тысяч транзакций. Управляет данными Сбера департамент SberData: нашими решениями пользуются свыше 22 тысяч сотрудников банка и экосистем. Мы разрабатываем продукт DataChat, который предоставляет сервисы подготовки метаданных для AI-ready хранилищ, поиска метаданных и извлечения данных на основе ЕЯ-запросов. Это позволит получать доступ к данным корпоративной аналитической платформы для AI-агентов и интеллектуальных помощников.

Используемые технологии: Python, Langchain / Langgraph, OpenSearch, RAG, graph search, Jenkins, OpenShift.

Задачи:

  • анализ, проектирование, разработка интегральных метрик сравнения контекстов поиска (метрика близости, схожести и тд областей метаданных)
  • анализ, проектирование, разработка метрик качества метаданных относительно точности поиска
  • анализ, проектирование, разработка типов проверок качества метаданных относительно точности поиска
  • анализ методов, проектирование и тестирование инструментов обогащения метаданных на основе документации и других источников
  • исследование методов оптимизации точности и НФТ путем использования методов NLP, NER, SLM и других альтернатив.

Мы ожидаем:

  • опыт работы 3-5 лет на позиции Data scientist в IT-команде, работающей по гибким методологиям: Scrum, Kanban
  • опыт анализа, проектирование и разработки инструментов на основе методов\технологий NLP, NER
  • знания и опыт использования существующих продуктов\инструментов NLP, NER, etc. (nltk, pymorphy2/3, SpaCy, natasha, etc.)
  • опыт обучения собственных языковых моделей на основе предобученых (BERT, разные типы реккурентных моделей, etc.).

Будет плюсом:

  • понимание принципов работы и опыт построения использования полнотекстовых индексов
  • теоретические знания и опыт работы с графовыми платформами (Spark GraphX, Neo4J, NetworkX)
  • опыт построения таксономий и онтологий
  • опыт в моделировании логических моделей данных.

Мы предлагаем:

  • комфортный современный офис: БЦ Даниловский форт, рядом с М.Тульская, Верхние котлы
  • возможность выбрать удобный график – офис/гибрид
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 2 часа назад

Похожие вакансии

Основные задачи: Работа с данными (очистка данных, исследование, feature engineering) Выдвижение и проверка гипотез Обсуждение задачи с бизнес заказчиками Разработка прогнозных моделей машинного обучения на основе табличных данных (прогноз продаж, пр...
  • Полный день
  • Опыт от 3 лет
Логотип компании Вкусно — и точкаВкусно — и точка
  • Москва
6 дней назад
от 350 000 ₽
Выше средней на 61%
Ищем (Senior) Data Scientist, который возьмёт на себя ключевую роль в развитии скоринговых и риск-моделей ... / churn / cross-sell модели Взаимодействовать с бизнесом, рисками, IT — переводить бизнес-задачи в data-решения ... менее опытных DS/аналитиков, участвовать в code review и выборе подходов Наши ожидания 3+ лет опыта в Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании МКК ДеньгиОКМКК ДеньгиОК
  • Москва
16 часов назад
Мы, команда в Unit Data B2C, разрабатываем внутреннее веб-приложение для создания и управления клиентскими ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
16 часов назад
Команда Intelligent Search, создаем поисковый сервис, который отвечает на запросы пользователей на естественном языке. Миссия команды: Сломать барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Мы предоставляем GigaChat до...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
7 дней назад
Сейчас мы ищем Middle+ / Senior NLP Engineers в команду Автоматизации коммуникаций с пользователями для ...
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.