- Работа в Москве
- Без опыта
- Разработчик
- Разработчик ML
Разработчик ML
По договоренности
- Савёловская
- Савёловская
- Савёловская
-
Создание системы для автоматической идентификации неизвестных солдат в архивах сервиса «Память народа» с использованием NLP и графовых связей.
Мы ищем специалиста, который создаст систему для автоматической идентификации неизвестных солдат в архивах сервиса «Память народа»:
— Поможет восстановить имена десятков тысяч солдат Великой Отечественной войны, чьи судьбы остались неизвестными;
— Научит модели находить связи там, где их не видно;
— Не боится генерить гипотезы и работать с большими данными (> 250 млн записей в БД, тысячи захоронений).Мы ждем, что вы имеете опыт в машинном обучении и анализе данных:
- Знание алгоритмов классификации, регрессии, кластеризации, рекомендательных систем;
- Опыт работы с графовыми данными (анализ связей, графовые эмбеддинги, методы вроде Adamic/Adar);
- Понимание вероятностных моделей и методов обработки разреженных/неполных данных.
- Опыт с распределенными системами (Spark, Hadoop, MapReduce).
-
Программирование и обработка текстовых данных:
- Python (библиотеки: scikit-learn, pandas, numpy, networkx).
- Опыт с ML-фреймворками (XGBoost, LightGBM, TensorFlow/PyTorch).
- Знание методов NLP (нормализация текста, fuzzy-matching, обработка опечаток).
-
В чем уникальность проекта:
Никто в мире ещё не связывал такие объёмы исторических данных с неизвестными солдатами. Вы станете пионером. Ваши алгоритмы помогут тысячам семей узнать судьбу своих предков.
- Знание алгоритмов классификации, регрессии, кластеризации, рекомендательных систем;
- Опыт работы с графовыми данными (анализ связей, графовые эмбеддинги, методы вроде Adamic/Adar);
- Понимание вероятностных моделей и методов обработки разреженных/неполных данных.
- Опыт с распределенными системами (Spark, Hadoop, MapReduce).
-
Программирование и обработка текстовых данных:
- Python (библиотеки: scikit-learn, pandas, numpy, networkx).
- Опыт с ML-фреймворками (XGBoost, LightGBM, TensorFlow/PyTorch).
- Знание методов NLP (нормализация текста, fuzzy-matching, обработка опечаток).
- Участие в социально-значимых проектах.
- Официальное оформление по ТК РФ.
- Возможность удаленной работы.
- Дружная команда.
Опубликована день назад