Data Scientist (SberWorks)

По договоренности


Мы – быстроразвивающаяся и очень дружная команда, которая занимается обеспечением безопасности данных в группе компаний Сбер.

В частности, сканированием баз данных на наличие персональных данных с применением комбинированного подхода из ML-моделей и стандартных программных средств, обезличиванием этих данных и подтверждением безопасного статуса исследуемой базы данных.

Наши задачи:

  • Решаем вопросы определения чувствительных данных, ищем закономерности в структурах данных, проверяем гипотезы
  • Готовим данные для всех этапов обучения моделей (в т.ч. LLM);
  • Организуем всю разметку для своих моделей
  • Проводим различные эксперименты для обучения моделей
  • Проектируем и реализуем новые решения на базе ML/LLM для решения поставленных задач.

Обязанности:

  • выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов
  • определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач
  • тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
  • оценка как полученное решение достигает поставленных целей
  • участие в разработке решения на основе GigaChat, LLAMA2
  • организация процесса мониторинга качества LLM
  • взаимодействие с другими участниками команды для совместной работы (проверки гипотез, исследований, внедрения)
  • внедрение успешных гипотез/моделей в промышленную эксплуатацию
  • следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.

Требования:

  • опыт работы в области DS от 3-х лет
  • знания в области теории вероятностей, статистики, оптимизации, численных методов
  • хорошие навыки программирования, знание Python, SQL
  • свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений
  • знание методов классического NLP, навыки Prompt Engineering
  • опыт работы с LLM-моделями (LLama, ChatGPT, GigaChat) и библиотеками LLM разработки LangChain, GigaChain
  • уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.

Мы предлагаем:

  • гибридный формат работы(
  • годовой бонус и ежегодный пересмотр зарплаты
  • статус аккредитованной ИТ-компании со всеми преимуществами
  • расширенный ДМС с первого дня и льготное страхование для семьи
  • корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
  • офис с видом на набережную, зонами отдыха и спортзалом
  • 90 дней удаленной работы
  • льготная ипотека в Сбере, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.

Поделиться:

Опубликована 3 дня назад

Похожие вакансии

Обязанности: Реализация проектов и мероприятий по анализу, сегментации и профилированию клиентской базы Банка в целях повышения эффективности продаж и коммуникаций с клиентами Анализ данных для выявления тенденций и паттернов в поведении клиентов. Ра...
  • Полный день
  • Опыт от 1 года
Логотип компании Московский Кредитный БанкМосковский Кредитный Банк
  • Москва
6 дней назад
Более 300 человек в Тюменском и Московском центрах разработки принимают активное участие в проектах компании, направленных на разработку наших внутренних ERP систем, приложений, интернет-магазинов. Ищем специалиста Data Science и Machine Learning для...
  • Полный день
  • Опыт от 1 года
Логотип компании Строительный ДворСтроительный Двор
  • Москва
3 дня назад
В продуктовую команду внедрения и развития искусственного интеллекта в сфере EdTech в СБЕРе ищем выдающегося Data Scientist/ML Engineer. Тебе предстоит заниматься разработкой ML-пайплайнов и AI-систем с использованием передовых технологий AI: NLP, LL...
  • Полный день
  • Опыт от 1 года
Логотип компании Корпоративный университет СбербанкаКорпоративный университет Сбербанка
  • Москва
6 дней назад
РТЛабс создаёт и развивает масштабные цифровые сервисы Госуслуг — портал, мобильные приложения, социально значимые услуги, системы электронного правительства. Наша команда делает жизнь миллионов пользователей проще и позволяет решать жизненные вопрос...
  • Полный день
  • Опыт от 1 года
Логотип компании РТЛабсРТЛабс
  • Москва
6 дней назад
В продуктовую команду внедрения и развития искусственного интеллекта в сфере EdTech в СБЕРе ищем выдающегося Data Scientist/ML Engineer. Тебе предстоит заниматься разработкой ML-пайплайнов и AI-систем с использованием передовых технологий AI: NLP, LL...
  • Полный день
  • Опыт от 1 года
Логотип компании Корпоративный университет СбербанкаКорпоративный университет Сбербанка
  • Москва
6 дней назад

Похожие вакансии

Логотип компании Московский Кредитный БанкМосковский Кредитный Банк
Логотип компании Строительный ДворСтроительный Двор
Логотип компании Корпоративный университет СбербанкаКорпоративный университет Сбербанка
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.