Middle ML Engineer (Computer Vision & NLP, Python / Golang, on-premise)

от 350 000 ₽

г Москва, Сколковское шоссе, д 43

Что предстоит делать

Направление

Коротко о задаче

Документы

OCR + KIE: извлекать структурированные данные из PDF-сканов паспортов, счет-фактур и пр.

Перевод

Построить пайплайн текст → другой язык (MT) и речь → текст → перевод → субтитры (ASR + MT + subtitle).

Биометрия

Сравнивать лицо на низкокачественном фото документа с селфи со смартфона.

Модерация контента

Автоматически проверять, соответствует ли изображение текстовому описанию (пример: «есть ли на фото футболист?»).

MLOps

Упаковывать модели в сервисы (REST/gRPC), писать тесты, метрики, поддерживать CI/CD в закрытом контуре.

Обязательные требования

2+ года коммерческого опыта в applied ML / CV / NLP.
Английский B2 и выше — умение читать техническую документацию, писать комментарии, тикеты, описания PR.
Уверенный Python 3.11+ (typing, OOP) и базовые знания Golang либо готовность освоить.
PyTorch (или TensorFlow) и Hugging Face: fine-tuning, inference, оптимизация на GPU/CPU.
OCR: Tesseract, PaddleOCR.
KIE: LayoutLMv3, Donut, TrOCR или аналоги (локальный fine-tune).
ASR: Open-source Whisper, Vosk, Coqui STT.
MT: MarianMT, M2M-100, OPUS-MT, T5, Argos Translate — всё локально.
Face recognition: InsightFace (ArcFace), Dlib, FaceNet, MediaPipe.
Мультимодальные/zero-shot модели: CLIP, BLIP-2, OWL-ViT (локальный inference).
Контейнеры: Docker; оркестрация: Kubernetes (on-prem), Helm.
Git, Linux, базовые принципы CI/CD и сетевой безопасности.

Будет плюсом

Английский устная коммуникация на уровне B2+/C1 — участие в звонках, ability to explain design decisions clearly
Участие в production-проектах на Golang (gRPC, concurrency).
MLflow, DVC, Airflow, Kubeflow — трекинг экспериментов и оркестрация.
Работа с облачными GPU-инфраструктурами (AWS SageMaker, GCP AI Platform, Azure ML).
Оптимизация моделей: ONNX, TensorRT, quantization, pruning.
Знание стандартов потокового аудио (WebRTC, HLS).
Опыт prompt-engineering / интеграции LLM (OpenAI, Llama 2/3).
Публикации на Kaggle, участие в open-source.

Что мы предлагаем

Опубликована 22 дня назад