Middle/Senior NLP/PLP Researcher (GigaCode R&D)

По договоренности

  • Спортивная
  • Киевская
  • Парк Победы

Мы — команда GigaCode, разрабатываем и развиваем AI-ассистента для разработчика. Целимся конкурировать с Copilot, Cursor, Windsurf и прочими инструментами.

Обучаем новые SOTA LLM по работе с кодом, как на уровне подсказок в IDE, так и на уровне редактирования целого проекта. Мы R&D команда, поэтому мы не только заимствуем лучшие решения из публикаций, но и ведем собственные исследования, публикуем статьи, open-source инструменты и датасеты.

Наши основные направления: претрейн кодовых моделей с нуля, пост-тренировка моделей (SFT/DPO/GRPO), обучение рассуждающих моделей, дообучение работе в агентном режиме и использованию инструментов, поиск в коде по текстовым запросам, ускорение инференса, дизайн бенчмарков, автоматическое создание датасетов проверяемых задач.

Обучаем модели на картах H100, на кластере Кристофари, у нас много свободы в использовании GPU.

Обязанности

  • дизайн экспериментов, формулировка гипотез для улучшения NLP/PLP моделей и алгоритмов, планирование исследовательских экспериментов с выводами
  • проведение экспериментов, написание кода, подготовка датасетов и бенчмарков, проведение замеров и анализ результатов
  • обучение моделей на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей
  • взаимодействие с прод-командой для интеграции моделей и алгоритмов в продакшн. Взаимодействуем с командой инженеров SberWorks
  • ориентированность на SOTA, читать пейперы, быть в курсе последних исследований, предлагать новые смелые подходы и направления.

Требования

  • хорошие теоретические знания в DL, с упором в современный NLP и трансформеры
  • умение формулировать эксперименты с научной строгостью, обосновывать их, проводить самостоятельно и делать выводы
  • опыт обучения трансформеров
  • опыт распределенного обучения моделей (deepspeed, fsdp, torch.distributed, accelerate)
  • знание стандартных библиотек для DL и NLP (PyTorch и библиотеки Huggingface)
  • увлеченность NLP/PLP и DL
  • опыт менторинга стажеров и младших коллег.

Будет плюсом:

  • опыт работы на похожей позиции
  • участие в соревнованиях по ML
  • сабмиты на лидербордах по NLP/PLP
  • публикации уровня А/A*, Q1
  • обучение моделей на кластере
  • опыт управления командой исследователей.

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Адрес: Россия, Москва, Кутузовский проспект, 32
Показать на большой карте

Поделиться:

Опубликована 7 дней назад

Похожие вакансии

Location: UAE, Dubai Type: Full-Time - Office-based role in Dubai Industry: Family Office About Us Overbest Middle East is a family office focused on systematic trading strategies in global futures markets (CME group, Eurex, HKEX, etc.). We are now l...
  • Полный день
  • Опыт от 3 лет
Логотип компании Овербест РусОвербест Рус
  • Москва
5 часов назад
Мы меняем подход к методам оценки риска. Наша команда разрабатывала transformer based архитектуры и подходы к их обучению для финансовых данных, и сейчас мы идем дальше — создаем мультимодальную reasoning модель, объединяющую цифровые следы клиента и...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
9 дней назад
PT SWARM — это команда из более чем 100 экспертов в offensive security, которые занимаются тестированием на проникновение (в том числе red teaming), анализом защищенности ПО (мобильных и веб-приложений, софта для финансовой отрасли), выполняют проект...
  • Полный день
  • Опыт от 3 лет
Логотип компании Positive TechnologiesPositive Technologies
  • Москва
18 дней назад
Мы используем всю мощь современных технологий ИИ для максимизации прибыли и улучшения клиентского опыта. У нас ты будешь работать с самыми современными технологиями AI: LLM, AI-агенты и доменно-адаптированные Transformers. Обязанности разработка AI-а...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
9 дней назад
Почему тебе понравится быть исследователем в Okko: не нужно объяснять командам ценность исследований — они и так это знают и сами приходят за помощью (можешь прийти и ты к ним); разнообразие исследуемых объектов, которым мало кто может похвастаться: ...
  • Полный день
  • Опыт от 3 лет
Логотип компании OkkoOkko
  • Москва
месяц назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.