Разработчик ML

По договоренности

г Москва, Бумажный проезд, д 14 стр 2
  • Савёловская
  • Савёловская
  • Савёловская

Обязанности:
  • Создание системы для автоматической идентификации неизвестных солдат в архивах сервиса «Память народа» с использованием NLP и графовых связей.

    Мы ищем специалиста, который создаст систему для автоматической идентификации неизвестных солдат в архивах сервиса «Память народа»:
    — Поможет восстановить имена десятков тысяч солдат Великой Отечественной войны, чьи судьбы остались неизвестными;
    — Научит модели находить связи там, где их не видно;
    — Не боится генерить гипотезы и работать с большими данными (> 250 млн записей в БД, тысячи захоронений).

    Мы ждем, что вы имеете опыт в машинном обучении и анализе данных:

  • Знание алгоритмов классификации, регрессии, кластеризации, рекомендательных систем;
  • Опыт работы с графовыми данными (анализ связей, графовые эмбеддинги, методы вроде Adamic/Adar);
  • Понимание вероятностных моделей и методов обработки разреженных/неполных данных.
  • Опыт с распределенными системами (Spark, Hadoop, MapReduce).
  • Программирование и обработка текстовых данных:

  • Python (библиотеки: scikit-learn, pandas, numpy, networkx).
  • Опыт с ML-фреймворками (XGBoost, LightGBM, TensorFlow/PyTorch).
  • Знание методов NLP (нормализация текста, fuzzy-matching, обработка опечаток).
  • В чем уникальность проекта:

    Никто в мире ещё не связывал такие объёмы исторических данных с неизвестными солдатами. Вы станете пионером. Ваши алгоритмы помогут тысячам семей узнать судьбу своих предков.

Требования:
  • Знание алгоритмов классификации, регрессии, кластеризации, рекомендательных систем;
  • Опыт работы с графовыми данными (анализ связей, графовые эмбеддинги, методы вроде Adamic/Adar);
  • Понимание вероятностных моделей и методов обработки разреженных/неполных данных.
  • Опыт с распределенными системами (Spark, Hadoop, MapReduce).
  • Программирование и обработка текстовых данных:

  • Python (библиотеки: scikit-learn, pandas, numpy, networkx).
  • Опыт с ML-фреймворками (XGBoost, LightGBM, TensorFlow/PyTorch).
  • Знание методов NLP (нормализация текста, fuzzy-matching, обработка опечаток).
Условия:
  • Участие в социально-значимых проектах.
  • Официальное оформление по ТК РФ.
  • Возможность удаленной работы.
  • Дружная команда.


Поделиться:

Опубликована день назад

Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.