- Работа в Санкт-Петербурге
- Удаленно
- IT engineer
- ML Engineer (Multi-modal)
ML Engineer (Multi-modal)
По договоренности
- Горьковская
- Невский проспект
- Сенная площадь
Наша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.
Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/
Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.
Приглашаем ML Engineer, который умеет работать с разными моделями и готов создавать передовые AI-решения на современных фреймворках.
Обязанности:
-  Построение и адаптация моделей с различными типами данных: NER, NLP, ASR, OCR, Computer Vision 
-  Проведение fine-tuning и разработка inference pipelines 
-  Подготовка и аннотирование данных для обучения моделей 
-  Работа с HuggingFace для использования и дообучения предобученных моделей 
-  Оптимизация моделей с помощью ONNX для ускорения вывода 
-  Внедрение и сопровождение моделей в продукционных системах 
Необходимый стек:
-  PyTorch, HuggingFace transformers 
-  OpenCV для обработки изображений и видео 
-  Whisper и OCR инструменты (Tesseract, PaddleOCR) 
-  LlamaIndex, LangChain для работы с LLM и цепочками обработки 
-  Векторные базы данных для поиска и хранения эмбеддингов 
-  Triton Inference Server для развертывания и оптимизации inference 
Требования:
-  Опыт разработки и внедрения моделей NLP, CV, ASR, OCR 
-  Знание современных архитектур и методов в области мульти-модального машинного обучения 
-  Умение работать с библиотеками PyTorch и HuggingFace 
-  Опыт создания и оптимизации inference pipeline 
-  Навыки подготовки и обработки данных для ML-задач 
-  Опыт работы с инструментами для производства и управления моделями (ONNX, Triton) 
-  Знание Python, понимание ML-цикла 
-  Работа над передовыми проектами в области мульти-модального ИИ 
-  Участие в масштабных проектах по обработке данных и автоматизации бизнес-процессов 
-  Содействие в развитии компании, возможность влиять на продукт и процессы компании, 
-  Работа в инновационной команде 
-  Достойная, конкурентоспособная заработная плата 
-  Удаленная работа, Гибкий график 
-  Возможность профессионального развития 
Опубликована 14 дней назад