ML-инженер (портал Рамблер)

По договоренности

г Москва, Варшавское шоссе, д 9 стр 1
  • Верхние Котлы
  • Тульская
  • ЗИЛ

Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», «Афиша» и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий.

Сейчас находимся в ML-разработчика в Отдел по разработке и внедрению AI портала Рамблер.

Задачи:
  • Разработка и тестирование алгоритмов RAG и LORA для генерации вопросов и ответов;
  • Создание алгоритмов для ведения свободного диалога с пользователем, включая фактчекинг и фильтрацию;
  • Анализ и сравнение результатов "Картины дня" после обработки редакцией и версий, созданных моделью;
  • Разработка пайплайна для суммаризации полезного контента;
  • Настройка навыков виртуального ассистента;
  • Создание и индексация векторных поисковых индексов для алгоритмов RAG.
Ожидания от кандидата (опционально):
  • Опыт работы в роли Data Scientist от 3 лет, предпочтительно в области обработки естественного языка (NLP);
  • Уверенные знания и опыт работы с библиотеками машинного обучения и NLP, такими как TensorFlow, PyTorch, Hugging Face и др.;
  • Опыт работы с алгоритмами RAG и LORA.;
  • Владение Python;
  • Знание SQL и опыт работы с базами данных.;
  • Работа с большими языковыми моделями (LLM), понимание архитектуры и принципов работы LLM, опыт использования популярных библиотек для работы с LLM, умение выполнять тонкую настройку (fine-tuning) моделей под конкретные задачи, создание и тестирование промтов (Prompt Engineering), опыт тестирования и оптимизации промтов, оценка производительности моделей (Benchmarking), создание бенчмарков для оценки качества работы моделей, знание метрик для оценки NLP-задач;
  • Знание особенностей задач NLP, опыт работы с текстовыми данными: предобработка, токенизация, лемматизация, стемминг, векторизация. Классификация, кластеризация, генерация, NER;
  • Навыки работы с поисковыми системами и задачами поиска, понимание принципов работы поисковых систем, знакомство с Elasticsearch, опыт создания и оптимизации поисковых запросов, умение работать с семантическим поиском.
Условия:
  • Официальное трудоустройство;
  • ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки;
  • Современный офис (Даниловская мануфактура, м. Тульская), бесплатный спорт в собственном спортзале от «Лиги Героев»;
  • Бесплатная подписка на сервисы партнеров;
  • Полный день в офисе, гибридный график или 100% дистанционный формат работы;
  • Льготные условия ипотеки в рамках зарплатного проекта;
  • Насыщенная корпоративная жизнь.


Поделиться:

Опубликована 13 дней назад

Вакансия в подборках

  1. Инженер ТО
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.