ML Engineer в команду компьютерного зрения и мультимодальных моделей в AI VK

По договоренности

  • Сокол
  • Аэропорт
  • Динамо

Группа машинного зрения направления R&D работает на стыке исследований и продуктовой разработки. Мы выходим за рамки стандартного анализа изображений и фокусируемся на мультимодальном ИИ для решения комплексных задач. Наша работа охватывает как критически важные бизнес-задачи, например высоконадёжную верификацию пользователей, так и амбициозные R&D-направления, включая визуально-языковые модели (VLM) для распознавания текстов и интеграцию визуальной модальности в речевые модели (SpeechLM).

Если вам интересно работать на стыке обработки пикселей и семантического понимания — вы наш кандидат.

Задачи

  • Next-Gen OCR: обучение визуально-языковых моделей (VLM) для задач OCR, переход от классических пайплайнов к end-to-end пониманию и извлечению структуры из документов
  • Исследования в мультимодальности: лидирование исследовательского трека по добавлению визуальной модальности в речевые языковые модели (SpeechLM), чтобы научить модели одновременно «видеть» и «говорить»
  • Верификация пользователей: создание и внедрение надёжных CV-моделей для верификации через камеру: распознавание лиц (Face Recognition), Liveness Detection и методы защиты от спуфинга (Anti-spoofing)
  • Оптимизация: Deep Learning моделей по скорости (latency) и памяти для работы в продакшен-окружении
  • Внедрение в production: взаимодействие с backend-разработчиками для вывода моделей в прод, обеспечение их надёжности и масштабируемости для будущих бизнес-задач
  • Research: мониторинг свежих статей на arXiv в областях CV, NLP и Multimodal Learning

Требования

  • 2+ года опыта в Computer Vision и Deep Learning, твёрдое понимание линейной алгебры, теории вероятностей и методов оптимизации
  • Отличное знание Python и фреймворков глубокого обучения (преимущественно PyTorch)
  • Глубокое понимание современных архитектур, особенно трансформеров (ViT) и CNN
  • Понимание того, как связывать разные модальности (например, выравнивание эмбеддингов изображений с аудио- или текстовыми токенами)
  • Практический опыт с задачами верификации/идентификации (ArcFace, Triplet Loss и так далее) или детекции/сегментации
  • Уверенное владение Git, умение писать чистый код и понимание базовых процессов MLOps

Будет плюсом

  • Опыт обучения или fine-tuning больших мультимодальных моделей (например, LLaVA, Qwen-VL)
  • Опыт оптимизации инференса: квантизация, TensorRT/Triton, ONNX, CUDA Graphs
  • Навыки обучения больших моделей с Mixed Precision и Distributed Data Parallel (DDP) в PyTorch
  • Опыт построения пайплайнов для генерации синтетических данных или использования Active Learning
  • Опыт чтения и воспроизведения алгоритмов из научных статей
  • Опыт работы с kubeflow и airflow

Адрес: Россия, Москва, Ленинградский проспект, 39с79
Показать на большой карте

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

LIMÉ-бренд одежды, обуви и аксессуаров, созданный в 2008 году. Наши магазины представлены в России и СНГ, а также онлайн с доставкой по всему миру. Наш успех заключается в слаженной командной работе, что позволяет бренду создавать востребованный каче...
  • Полный день
  • Опыт от 3 лет
Логотип компании Бренд одежды, обуви и аксессуаров LIMÉБренд одежды, обуви и аксессуаров LIMÉ
  • Москва
день назад
Мы всегда рады знакомству с новыми людьми, которые разделяют наши ценности и позитивный настрой. ВАМ ПРЕДСТОИТ: Задачи в части разработки продукта: Создание "Концепта категории" на коллекцию (фит, материал, цвет, и др продуктовые параметры); Поиск ко...
  • Полный день
  • Опыт от 3 лет
Логотип компании Бренд одежды, обуви и аксессуаров LIMÉБренд одежды, обуви и аксессуаров LIMÉ
  • Москва
день назад
от 200 000 ₽
Рыночная зарплата
В компанию производителя дистрибутора строительного оборудования и материалов (опалубка) требуется: Разработчик 1С. Обязанности: · Доработка, тестирование, отладка и сопровождение конфигураций 1С ERP ; · Участие в проектах интеграции с другими систем...
  • Полный день
  • Опыт от 3 лет
Логотип компании ОРИОНИКА,ООООРИОНИКА,ООО
  • Москва
2 дня назад
от 200 000 ₽
Рыночная зарплата
В компанию производителя дистрибутора строительного оборудования и материалов (опалубка) требуется: Разработчик 1С. Обязанности: · Доработка, тестирование, отладка и сопровождение конфигураций 1С ERP ; · Участие в проектах интеграции с другими систем...
  • Полный день
  • Опыт от 3 лет
Логотип компании ОРИОНИКА,ООООРИОНИКА,ООО
  • Москва
3 дня назад
Чем предстоит заниматься курированием региональной фронт-линии в сети (ДирПиО и ОЮЛ) организацией продаж и операционного обслуживания выстраиванием сервисной модели проектной деятельностью на уровне ГО Наши ожидания получили высшее образование релева...
  • Полный день
  • Опыт от 3 лет
Логотип компании БАНК УРАЛСИББАНК УРАЛСИБ
  • Москва
день назад
В команде администрирования СЗИ открыта позиция инженера по обслуживанию NGFW. Ребята занимаются эксплуатацией и внедрением различных средств защиты информации в облачной инфраструктуре В задачи будет входить: Развертывание, настройка, введение в экс...
  • Полный день
  • Опыт от 3 лет
Логотип компании РТК-ЦОДРТК-ЦОД
  • Москва
2 дня назад

Похожие вакансии

Логотип компании Бренд одежды, обуви и аксессуаров LIMÉБренд одежды, обуви и аксессуаров LIMÉ
Логотип компании Бренд одежды, обуви и аксессуаров LIMÉБренд одежды, обуви и аксессуаров LIMÉ
от 200 000 ₽
Логотип компании ОРИОНИКА,ООООРИОНИКА,ООО
от 200 000 ₽
Логотип компании ОРИОНИКА,ООООРИОНИКА,ООО
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.