Middle ML Engineer (Computer Vision & NLP, Python / Golang, on-premise)

от 350 000 ₽

г Москва, Сколковское шоссе, д 43
  • Немчиновка
  • Сетунь
  • Рабочий поселок

Что предстоит делать

Направление

Коротко о задаче

Документы

OCR + KIE: извлекать структурированные данные из PDF-сканов паспортов, счет-фактур и пр.

Перевод

Построить пайплайн текст → другой язык (MT) и речь → текст → перевод → субтитры (ASR + MT + subtitle).

Биометрия

Сравнивать лицо на низкокачественном фото документа с селфи со смартфона.

Модерация контента

Автоматически проверять, соответствует ли изображение текстовому описанию (пример: «есть ли на фото футболист?»).

MLOps

Упаковывать модели в сервисы (REST/gRPC), писать тесты, метрики, поддерживать CI/CD в закрытом контуре.

Обязательные требования

  • 2+ года коммерческого опыта в applied ML / CV / NLP.
  • Английский B2 и выше — умение читать техническую документацию, писать комментарии, тикеты, описания PR.
  • Уверенный Python 3.11+ (typing, OOP) и базовые знания Golang либо готовность освоить.
  • PyTorch (или TensorFlow) и Hugging Face: fine-tuning, inference, оптимизация на GPU/CPU.
  • OCR: Tesseract, PaddleOCR.
  • KIE: LayoutLMv3, Donut, TrOCR или аналоги (локальный fine-tune).
  • ASR: Open-source Whisper, Vosk, Coqui STT.
  • MT: MarianMT, M2M-100, OPUS-MT, T5, Argos Translate — всё локально.
  • Face recognition: InsightFace (ArcFace), Dlib, FaceNet, MediaPipe.
  • Мультимодальные/zero-shot модели: CLIP, BLIP-2, OWL-ViT (локальный inference).
  • Контейнеры: Docker; оркестрация: Kubernetes (on-prem), Helm.
  • Git, Linux, базовые принципы CI/CD и сетевой безопасности.

Будет плюсом

  • Английский устная коммуникация на уровне B2+/C1 — участие в звонках, ability to explain design decisions clearly
    Участие в production-проектах на Golang (gRPC, concurrency).
  • MLflow, DVC, Airflow, Kubeflow — трекинг экспериментов и оркестрация.
  • Работа с облачными GPU-инфраструктурами (AWS SageMaker, GCP AI Platform, Azure ML).
  • Оптимизация моделей: ONNX, TensorRT, quantization, pruning.
  • Знание стандартов потокового аудио (WebRTC, HLS).
  • Опыт prompt-engineering / интеграции LLM (OpenAI, Llama 2/3).
  • Публикации на Kaggle, участие в open-source.

Что мы предлагаем

  • Задачи уровня R&D с возможностью влиять на выбор моделей и архитектур.
  • Доступ к выделенным GPU-нодам и бюджет на облачные эксперименты.
  • Оформление по ТК РФ, гибкий график, 28 дней отпуска.
  • Прозрачная грейд-матрица и ревью каждые 6 мес.


Поделиться:

Опубликована 2 дня назад

Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.