Deep learning researcher engineer, sequence models (команда B2C)
По договоренности
Наша команда занимается исследованием и разработкой больших нейронных сетей на данных банка. Мы сфокусированы на создании новой модельной платформы: исследуем архитектуры, способы обучения и представления данных, чтобы построить универсальную большую мультимодальную модель на различных источниках клиентских сигналов. Тебе предстоит присоединиться к небольшой сильной команде, которая работает на стыке representation learning, sequence modeling, multimodality и foundation-моделей на финансовых данных и цифровых следах клиентов. У нас много данных, серьезные вычислительные ресурсы и редкая возможность не адаптировать чужие идеи, а формировать собственное направление исследований.
Обязанности
- Проводить research полного цикла: формулировать сильные гипотезы, проектировать эксперименты, глубоко анализировать результаты и на их основе принимать решения о том, куда двигать модель дальше
- Искать и прорабатывать направления улучшения больших моделей: новые источники данных, архитектурные решения, objective-функции, режимы обучения, способы объединения разнородных сигналов и подходы к мультимодальному обучению
- Определять вектор развития направления: помогать коллегам в выборе решений, формировать и приоритизировать исследовательский backlog, удерживать высокий темп экспериментов и поддерживать техническую целостность работы команды
- Автоматизировать исследовательскую рутину, превращая эксперименты в воспроизводимые пайплайны, удобные инструменты и инфраструктуру, которая позволяет быстро и качественно проверять гипотезы.
Требования
- Сильный опыт работы в DS/ML/DL, желательно в роли senior researcher, staff-level individual contributor или tech lead
- Отличное понимание современных deep learning подходов, прежде всего transformer-based архитектур, representation learning и практики обучения больших моделей
- Отличное знание PyTorch (must, это то, без чего ты не сможешь работать)
- Практический опыт distributed training больших моделей на терабайтных объёмах данных: multi-GPU / multi-node обучение, эффективная загрузка и подготовка данных, оптимизация скорости и стабильности обучения
- Опыт самостоятельного ведения исследований: от постановки гипотез и дизайна экспериментов до интерпретации результатов и выбора следующего исследовательского шага
- Опыт работы с неидеальными, разнородными и масштабными данными и умение превращать их в работающие обучающие постановки.
Будет плюсом:
- Опыт работы с большими языковыми моделями, мультимодальными моделями, sequence modeling или representation learning на пользовательских событиях
- Опыт обучения моделей на больших объёмах слабоструктурированных данных, включая финансовые данные, клиентские события и цифровые следы
- Опыт неформального или формального техлидства: помощь коллегам, формирование backlog исследований, приоритизация направлений и удержание высокого качества исследовательской работы команды
- Сильный трек-рекорд в исследованиях: заметные результаты, open-source, ML-соревнования или другие подтверждения исследовательской силы
- Опыт с distributed training, инфраструктурой экспериментов, data pipelines и инструментами, которые ускоряют цикл экспериментов.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - гибрид
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 4 часа назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX 250 000 - 300 000 ₽
Выше средней на 18%
Развитие IT-инфраструктуры и документация: - Мониторинг работоспособности IT-сервисов и оборудования. ... - Участие в планировании, модернизации и развитии IT-инфраструктуры компании. - Ведение технической ... Что мы ждем от вас: - Опыт работы системным администратором или инженером IT-инфраструктуры от 5 лет.
- Полный день
- Опыт от 5 лет
- Москва
4 часа назад
Медиалогия занимается разработкой продуктов по сбору и анализу данных из СМИ и соцмедиа. Мы разрабатываем высоконагруженные системы, которые в режиме реального времени сканируют весь текстовый сегмент Интернета (100+ млн. сообщений в сутки, 1.7 млрд....
- Полный день
- Опыт от 5 лет
- Москва
4 часа назад
ГК Баланс-Платформа разыскивает в коммерческий департамент успешного Account manager (IT/Fintech), который ... Обязанности: Полный цикл продаж нашей IT-платформы: от поиска клиента до закрытия сделки. ... Опыт В2В продаж IT-решений, большие чеки сделок.
- Полный день
- Опыт от 5 лет
- Москва
день назад
Обязанности: Проектирование workflow: от сбора требований до деплоя дашбордов/виджетов (сбор данных → ETL → визуализация → интеграции) Развертывание инструментов DevOps: CI/CD пайплайны (Git, Jenkins/ArgoCD), управление релизами, code review процессы...
- Полный день
- Опыт от 5 лет
- Москва
4 часа назад
Рositive Technologies — компания с двадцатилетней историей в сфере информационной безопасности.Мы разрабатываем продукты и сервисы в области противодействия современным киберугрозам. Создаем решения и технологии, которые защищают от злоумышленников и...
- Полный день
- Опыт от 5 лет
- Москва
22 дня назад
Вакансия в подборках
Похожие вакансии
250 000 - 300 000 ₽