Специалист по обработке источников (веб-скрейпинг/RSS, CSS-селекторы)
50 000 - 60 000 ₽
О продукте
Разрабатываем систему мониторинга новостных сайтов. Внутренняя админка позволяет настраивать парсинг: контейнер статьи, заголовок, дата, автор, контент, изображения; поддержку lazy-load, meta/time, исключения, куки/прокси/Puppeteer, RSS/Atom.
-
Искать и подтверждать фиды: RSS/Atom/JSON Feed/сайтмапы, проверять валидность, периодичность обновлений.
-
Подбирать корректные CSS-селекторы/XPath, учитывать data-src/srcset, OpenGraph, itemprop, локальные форматы даты/времени и таймзоны.
-
Проверять результат в нашей админке, фиксировать комментарии, статус, частоту обхода, проблемы.
-
Ревизия существующих источников: чинить поломавшиеся селекторы, отмечать антибот/нужен Puppeteer/нужны прокси/куки.
-
Вести аккуратную отчётность.
-
KPI: ≥100 источников в сутки
-
Уверенное владение CSS-селекторами и DevTools (умение быстро найти нужный узел, использовать псевдоклассы :not, :nth-child, атрибутные селекторы и т. п.).
-
Понимание структуры HTML (семантика article, time, meta[itemprop], figure, OG-теги).
-
Опыт работы с RSS/Atom, базовая диагностика валидности фида.
-
Навык обхода lazy-loading изображений (data-src, srcset), извлечение content/datetime.
-
Грамотность, внимательность к мелочам, умение работать монотонно без падения качества.
-
Удалёнка (либо офис в Ереване), гибкий график.
-
Оплата: ставка или сдельно — по согласованным метрикам и скорости. Выплаты 2 раза в месяц.
-
Обучающие примеры, наставничество.
-
Договор ГПХ/самозанятый.
Опубликована 17 часов назад