Data Scientist (OCR, VLM)

По договоренности


Находимся в поисках Data Scientist для собственного продукта в направлении Искусственного интеллекта.

Задачи, которые мы предлагаем:

  • Разработка и внедрение систем OCR/Document Understanding на базе классических и VLM-моделей.
  • Интеграция визуальных моделей с LLM в рамках RAG-сервисов и ассистентов.
  • Обработка и анализ визуальных данных: сканы, формы, PDF-документы, табличные структуры, изображения.
  • Проектирование архитектуры ML-пайплайнов и расчет необходимых ресурсов.
  • Участие в разработке backend-части сервисов и API.
  • Подготовка прототипов и демо для пресейлов и пилотных проектов.
  • Взаимодействие с заказчиком, уточнение требований и сопровождение решений.

Знания и навыки,которые для нас важны:

  • Навыки дообучения и тонкой настройки моделей CV/VLM на кастомных датасетах.
  • Понимание мультимодальных пайплайнов: RAG + VLM, OCR + LLM.
  • Уверенное знание Python, опыт работы с Pandas, NumPy, OpenCV, PIL.
  • Опыт работы с OCR-фреймворками: EasyOCR, Tesseract, MMOCR, PaddleOCR и др.
  • Знание и применение визуально-языковых моделей (BLIP, Donut, Pix2Struct, LayoutLM, Qwen-VL и др.).
  • Опыт интеграции моделей в пайплайны: обработка документов, табличных структур, чеков, сканов и рукописного текста.

Поделиться:

Опубликована 14 часов назад

Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.