Data Scientist (OCR, VLM)

По договоренности

Находимся в поисках Data Scientist для собственного продукта в направлении Искусственного интеллекта.

Задачи, которые мы предлагаем:

Разработка и внедрение систем OCR/Document Understanding на базе классических и VLM-моделей.
Интеграция визуальных моделей с LLM в рамках RAG-сервисов и ассистентов.
Обработка и анализ визуальных данных: сканы, формы, PDF-документы, табличные структуры, изображения.
Проектирование архитектуры ML-пайплайнов и расчет необходимых ресурсов.
Участие в разработке backend-части сервисов и API.
Подготовка прототипов и демо для пресейлов и пилотных проектов.
Взаимодействие с заказчиком, уточнение требований и сопровождение решений.

Знания и навыки,которые для нас важны:

Навыки дообучения и тонкой настройки моделей CV/VLM на кастомных датасетах.
Понимание мультимодальных пайплайнов: RAG + VLM, OCR + LLM.
Уверенное знание Python, опыт работы с Pandas, NumPy, OpenCV, PIL.
Опыт работы с OCR-фреймворками: EasyOCR, Tesseract, MMOCR, PaddleOCR и др.
Знание и применение визуально-языковых моделей (BLIP, Donut, Pix2Struct, LayoutLM, Qwen-VL и др.).
Опыт интеграции моделей в пайплайны: обработка документов, табличных структур, чеков, сканов и рукописного текста.

Опубликована 14 часов назад