Deep learning researcher engineer, sequence models (команда B2C)

По договоренности


Наша команда занимается исследованием и разработкой больших нейронных сетей на данных банка. Мы сфокусированы на создании новой модельной платформы: исследуем архитектуры, способы обучения и представления данных, чтобы построить универсальную большую мультимодальную модель на различных источниках клиентских сигналов. Тебе предстоит присоединиться к небольшой сильной команде, которая работает на стыке representation learning, sequence modeling, multimodality и foundation-моделей на финансовых данных и цифровых следах клиентов. У нас много данных, серьезные вычислительные ресурсы и редкая возможность не адаптировать чужие идеи, а формировать собственное направление исследований.

Обязанности

  • Проводить research полного цикла: формулировать сильные гипотезы, проектировать эксперименты, глубоко анализировать результаты и на их основе принимать решения о том, куда двигать модель дальше
  • Искать и прорабатывать направления улучшения больших моделей: новые источники данных, архитектурные решения, objective-функции, режимы обучения, способы объединения разнородных сигналов и подходы к мультимодальному обучению
  • Определять вектор развития направления: помогать коллегам в выборе решений, формировать и приоритизировать исследовательский backlog, удерживать высокий темп экспериментов и поддерживать техническую целостность работы команды
  • Автоматизировать исследовательскую рутину, превращая эксперименты в воспроизводимые пайплайны, удобные инструменты и инфраструктуру, которая позволяет быстро и качественно проверять гипотезы.

Требования

  • Сильный опыт работы в DS/ML/DL, желательно в роли senior researcher, staff-level individual contributor или tech lead
  • Отличное понимание современных deep learning подходов, прежде всего transformer-based архитектур, representation learning и практики обучения больших моделей
  • Отличное знание PyTorch (must, это то, без чего ты не сможешь работать)
  • Практический опыт distributed training больших моделей на терабайтных объемах данных: multi-GPU / multi-node обучение, эффективная загрузка и подготовка данных, оптимизация скорости и стабильности обучения
  • Опыт самостоятельного ведения исследований: от постановки гипотез и дизайна экспериментов до интерпретации результатов и выбора следующего исследовательского шага
  • Опыт работы с неидеальными, разнородными и масштабными данными и умение превращать их в работающие обучающие постановки.

Будет плюсом:

  • Опыт работы с большими языковыми моделями, мультимодальными моделями, sequence modeling или representation learning на пользовательских событиях
  • Опыт обучения моделей на больших объемах слабоструктурированных данных, включая финансовые данные, клиентские события и цифровые следы
  • Опыт неформального или формального техлидства: помощь коллегам, формирование backlog исследований, приоритизация направлений и удержание высокого качества исследовательской работы команды
  • Сильный трек-рекорд в исследованиях: заметные результаты, open-source, ML-соревнования или другие подтверждения исследовательской силы
  • Опыт с distributed training, инфраструктурой экспериментов, data pipelines и инструментами, которые ускоряют цикл экспериментов.

Условия

  • Комфортный современный офис рядом с м. Кутузовская
  • Формат работы - гибрид
  • Ежегодный пересмотр зарплаты, годовая премия
  • Корпоративный спортзал и зоны отдыха
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 8 часов назад

Похожие вакансии

Positive Technologies — место, где ты можешь быть собой, брать на себя ответственность и решать сложные, но очень интересные задачи. Чтобы по-настоящему делать мир безопаснее. В окружении тех, кому не все равно. Hackers — это команда экспертов, котор...
  • Полный день
  • Опыт от 5 лет
Логотип компании Positive TechnologiesPositive Technologies
  • Москва
12 дней назад
Наша команда развивает мобильные приложения, сервисы и другие IT-системы; занимается разработкой стандартов ... и планов проектов перед ключевыми стейкхолдерами и руководством Формирование и управление портфелем IT-проектов ... Опыт работы или глубокое понимание специфики IT-проектов для блока продаж, B2B-сектора будет преимуществом ...
  • Полный день
  • Опыт от 5 лет
Логотип компании ЛУКОЙЛЛУКОЙЛ
  • Москва
8 часов назад
Чем предстоит заниматься: Полное управление IT-инфраструктурой и командой, стратегическое развитие IT-службы ... соблюдение требований ФСТЭК/ФЗ-152 в рамках концепции Zero Trust; Ожидаем от кандидата: Опыт руководства IT-службой ...
  • Полный день
  • Опыт от 5 лет
Логотип компании АвантаАванта
  • Москва
9 дней назад
Сейчас усиливаем направление и ищем Директора проектов, который будет отвечать за реализацию и развитие портфеля проектов у крупных enterprise-клиентов. Это роль не про классическое управление «сверху», а про работу в консалтинговой модели: с высокой...
  • Полный день
  • Опыт от 5 лет
Логотип компании КОРУС КонсалтингКОРУС Консалтинг
  • Москва
3 дня назад
Обязанности: контроль управления портфелем проектов и задач розничного бизнеса с ИТ-составляющей; содействие внедрению продуктовых стандартов и повышению качества работы продуктовых подразделений розничного бизнеса в соответствии с действующей методо...
  • Полный день
  • Опыт от 5 лет
Логотип компании Банк ВТБ (ПАО)Банк ВТБ (ПАО)
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.