Middle+/Senior Data Engineer (Image & Video)

По договоренности

  • Смоленская
  • Киевская
  • Фили

Мы поисках Middle+/Senior Data Engineer (Image & Video) на проект по интелекуальному видеонаблюдению.

Ищем инженера для сбора, очистки и контроля качества изображений и видео из открытых источников. Роль сфокусирована на стабильном и легальном сборе данных, их технической подготовке и базовой аналитической проверке перед передачей в ML команду.

Продукт: облачная видео-платформа, цель которой анализировать огромное количество видеопотоков, детектировать события и производить поиск по ним в реальном времени.

Продукт на данный момент помогает крупным компаниям решать различные задачи: пропуск сотрудников в производственные помещения, обнаружения пожаров, расследование инцидентов и др. На рынке уже порядка 15 лет и имеет амбициозные перспективы для дальнейшего развития. География продукта покрывает множество стран СНГ, Азии и другие.

Технологии: продукт включает в себя множество сервисов, реализованных на Java, Go, C++, и разворачивающихся в виде контейнеров в Kubernetes.

Команда проекта: 65+ человек: Back-end (Java), Front-End (Angular), Manual QA + AQA(Python), R&D (аналитика на C++, DL Engineer), Admin (k9s cluster).

Обязанности:

  • Сбор изображений и видео из открытых источников (web, python API, публичные датасеты, production кластеры);

  • Разработка и поддержка Python-скриптов и пайплайнов сбора данных;

  • Очистка и подготовка данных: изображения, видео, метаданные;

  • Контроль качества данных: проверка blur / резкости, контроль размеров, разрешений и форматов, выявление пустых, битых и дублирующихся кадров;

  • Базовая аналитика датасетов: подсчёт объёмов и распределений, проверка полноты и однородности данных, простые метрики качества;

  • Подготовка данных в формате, готовом к использованию ML-командой.

Требования

Языки и инструменты:

  • Python — уверенный уровень;

  • Инструменты веб-сбора: Requests, BeautifulSoup, Selenium, Scrapy;

  • Опыт сбора и парсинга данных от 2 лет.

Общие требования по сбору:

  • Бытовая сообразительность, необходимая для нахождения путей решения нестандартных задач сбора;

  • Коммуникабельность, готовность находить людей, необходимых для решения конкретных задач сбора и общаться с ними до получения нужных данных;

  • Английский язык на уровне письменной коммуникации с сотрудниками из других регионов для организации удаленного сбора: B1 или выше.

Работа с изображениями и видео

  • Понимание форматов: JPEG / PNG; MP4 / AVI;

  • Опыт работы с: OpenCV, ffmpeg, PIL;

  • Умение: извлекать кадры из видео, масштабировать и кропать изображения, применять базовые фильтры, автоматизировать проверки качества данных.

Аналитическая база (базовый уровень):

  • Понимание принципов качества данных (data quality);

  • Работа с метаданными и простыми агрегатами;

  • Умение оценивать датасет и находить проблемы до передачи в ML.

Инфраструктура:

  • Python

  • Linux

  • Docker

Будет плюсом

  • Понимание Computer Vision / ML на концептуальном уровне;

  • Знание принципов: object detection, OCR, video analytics;

  • Опыт работы с: YOLO, Qwen VL;

  • Базовое понимание ML-pipeline;

  • Опыт работы с чувствительными данными и понимание юридических ограничений;

  • Опыт использования OpenRouter;

  • Опыт работы с Яндекс Толока и Amazon Turk.


Адрес: Россия, Москва, Мантулинская улица, 24
Показать на большой карте

Поделиться:

Опубликована 16 часов назад

Похожие вакансии

250 000 - 340 000 ₽
Выше средней на 18%
Наши пожелания к кандидатам: От 2-3 лет в роли, связанной с построением аналитической инфраструктуры (Data ... Engineer) или созданием инструментов для бизнес-анализа (BI-разработчик), с применением сходного технологического ... Будет плюсом: Визуализация данных с помощью Power BI (DAX, Power Query, работа с Data Gateways) и/или ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании LIANLIAN
  • Москва
4 дня назад
Находимся в поисках Инженера данных (data engineer) для главного Портала Москвы - Mos.ru, на котором ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
день назад
Мы ищем опытного Data Engineer, который усилит команду разработки внутренней платформы Flocktory. ... Engineer, инженер хранилища данных от 3х лет; опыт решения задач репликации данных, создания слоев данных ... data mesh.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании FlocktoryFlocktory
  • Москва
4 дня назад
до 250 000 ₽
Рыночная зарплата
... архитектуры хранилища; Документирование архитектуры и процессов обработки данных; Требования: Опыт работы Data ... Engineer от 2-ух лет; Уверенное владение Python 3.8+.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МФК ВЭББАНКИРМФК ВЭББАНКИР
  • Москва
7 дней назад
Spark (от 3 лет), знание Pyspark; • Опыт с Iceberg (обязательно); • Знания Spark архитектуры, и Big Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании NeoflexNeoflex
  • Москва
день назад
Обязанности: Разработка и поддержка логической и физической моделей данных хранилища Проектирование, разработка и поддержка ETL процессов Создание витрин данных для BI-отчетности и аналитики Взаимодействие с аналитиками и смежными подразделениями для...
  • Можно удаленно
  • Подработка
  • Опыт от 3 лет
Логотип компании LAB IndustriesLAB Industries
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.