ML/Data Engineer

По договоренности


Мы разрабатываем высоконагруженную AI-платформу, которая помогает юристам готовить международные договоры.

Состоит из трёх больших блоков:

  • Динамический UI - сочетает в себе окно поиска по базам знаний и область для договоров, графиков и форм.
  • Мультиагентная система – обрабатывает запросы пользователя, формирует договоры, редактирует, переводит и т.д.
  • Гибридная база знаний – сочетает семантический (векторный) поиск и графовые связи.

Первый этап отбора на эту вакансию – общение с AI-рекрутером:

  • после отклика вам на почту и в чат на платформе HeadHunter придет приглашение побеседовать с ГигаРекрутером в Telegram
  • диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры
  • ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Чем предстоит заниматься:

  • разработка и поддержка ETL-пайплайнов для парсинга законов Гонконга, английских статутов и санкционных источников (OFAC, EU, UK)
  • построение гибридной базы знаний: векторное хранилище Milvus, графовая БД Neo4j, PostgreSQL для метаданных
  • проектирование модели данных для договоров, законодательных норм, санкционных списков и графовых связей
  • настройка автоматического ежесуточного обновления санкционных списков с оповещением об изменениях
  • fine-tuning юридических эмбеддинг-моделей (LegalBERT) и/или малых LLM для извлечения сущностей
  • создание бенчмарков и метрик качества поиска (Hit Rate, MRR, Recall) и защиты от галлюцинаций
  • организация версионирования данных и моделей (DVC, MLflow) с возможностью отката при ошибках

Мы ожидаем, что ты имеешь:

  • опыт работы с текстами: парсинг PDF/HTML, чистка, нормализация и Python: pandas, numpy, transformers, PyTorch
  • практическую работу с векторными БД (Milvus / Qdrant / Weaviate): индексация, гибридный поиск, управление схемой
  • опыт с графовыми БД (Neo4j, Cypher): построение онтологий, запросы связей
  • знание реляционных БД: PostgreSQL, включая полнотекстовый поиск и pgvector
  • опыт оркестрации ETL (Airflow / Prefect / Dagster) и работы с брокерами сообщений (Kafka)
  • MLOps: DVC, MLflow, деплой моделей в Docker/K8s; fine-tuning через Hugging Face (PEFT, LoRA)
  • production-опыт с LangGraph (Python) и LangChain, а также понимание TypeScript-версии LangGraph (или готовность освоить).

Будет плюсом:

  • понимание common law / права Гонконга
  • опыт парсинга санкционных XML/CSV/JSON
  • практика с Spark/Dask, OWL/RDF.

Работа у нас – это:

  • работа в стартап-культуре: минимум бюрократии, гибкие процессы и быстрые релизы
  • гибридный график (2-3 дня в неделю из дома)
  • современный офис на ул Поклонной, 3к3
  • ежегодный пересмотр зарплаты и годовая премия
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • программа адаптации и помощь наставника на старте
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • льготная ипотека и кредитование от Сбера
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

Поделиться:

Опубликована 13 часов назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Миссия роли / О роли Обеспечить бесперебойную работу офиса Чем предстоит заниматься Регистрировать заявки в сервис-деск системе, соблюдать сроки их выполнения. Осуществлять техническую поддержку пользователей и клиентов по полному циклу работ: от инс...
  • Полный день
  • Опыт от 3 лет
Логотип компании 12 STOREEZ12 STOREEZ
  • Москва
8 дней назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
13 часов назад
Цифровые Привычки – аккредитованная IT-компания, резидент Сколково, топ-5 подрядчиков Сбера. ... Мы предоставляем услуги IT-консалтинга, заказной разработки, аутсорсинга IT-процессов и развиваем собственные ... в области ИТ Опыт работы в должности data engineer от 3х лет Опыт программирования на Python (FastApi ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Цифровые привычкиЦифровые привычки
  • Москва
4 дня назад
Сейчас у нас открыта вакансия Enterprise Engineer в команду, которая занимается поддержкой, обслуживанием ... Экспертная поддержка территориально распределённых IT-подразделений. ... Экспертная поддержка территориально распределенных IT-подразделений.
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
5 дней назад
от 380 000 ₽
Выше средней на 109%
Мы - Eyes of Wonder, стартап-студия, более 10 лет создающая успешные IT продукты в сфере браузерных технологий ... , Kubernetes, Docker, Kafka, Grafana, Prometheus Требования: Опыт в качестве Senior/Lead DevOps/SRE engineer ...
  • Полный день
  • Опыт от 3 лет
Логотип компании EYES OF WONDER SOFTWARE LLCEYES OF WONDER SOFTWARE LLC
  • Москва
13 часов назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media ... Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
8 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.