- Работа в Нижнем Новгороде
- Удаленно
- Data scientist
- Data Scientist (OCR, VLM)
Data Scientist (OCR, VLM)
По договоренности
Находимся в поисках Data Scientist для собственного продукта в направлении Искусственного интеллекта.
Задачи, которые мы предлагаем:
- Разработка и внедрение систем OCR/Document Understanding на базе классических и VLM-моделей.
- Интеграция визуальных моделей с LLM в рамках RAG-сервисов и ассистентов.
- Обработка и анализ визуальных данных: сканы, формы, PDF-документы, табличные структуры, изображения.
- Проектирование архитектуры ML-пайплайнов и расчет необходимых ресурсов.
- Участие в разработке backend-части сервисов и API.
- Подготовка прототипов и демо для пресейлов и пилотных проектов.
- Взаимодействие с заказчиком, уточнение требований и сопровождение решений.
Знания и навыки,которые для нас важны:
- Навыки дообучения и тонкой настройки моделей CV/VLM на кастомных датасетах.
- Понимание мультимодальных пайплайнов: RAG + VLM, OCR + LLM.
- Уверенное знание Python, опыт работы с Pandas, NumPy, OpenCV, PIL.
- Опыт работы с OCR-фреймворками: EasyOCR, Tesseract, MMOCR, PaddleOCR и др.
- Знание и применение визуально-языковых моделей (BLIP, Donut, Pix2Struct, LayoutLM, Qwen-VL и др.).
- Опыт интеграции моделей в пайплайны: обработка документов, табличных структур, чеков, сканов и рукописного текста.
Поделиться:
Опубликована 14 часов назад