- Работа в Москве
- IT, интернет, связь, телеком
- Инженер
- ML-инженер (портал Рамблер)
ML-инженер (портал Рамблер)
По договоренности
г Москва, Варшавское шоссе, д 9 стр 1
- Верхние Котлы
- Тульская
- ЗИЛ
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», «Афиша» и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий.
Сейчас находимся в ML-разработчика в Отдел по разработке и внедрению AI портала Рамблер.
Задачи:- Разработка и тестирование алгоритмов RAG и LORA для генерации вопросов и ответов;
- Создание алгоритмов для ведения свободного диалога с пользователем, включая фактчекинг и фильтрацию;
- Анализ и сравнение результатов "Картины дня" после обработки редакцией и версий, созданных моделью;
- Разработка пайплайна для суммаризации полезного контента;
- Настройка навыков виртуального ассистента;
- Создание и индексация векторных поисковых индексов для алгоритмов RAG.
- Опыт работы в роли Data Scientist от 3 лет, предпочтительно в области обработки естественного языка (NLP);
- Уверенные знания и опыт работы с библиотеками машинного обучения и NLP, такими как TensorFlow, PyTorch, Hugging Face и др.;
- Опыт работы с алгоритмами RAG и LORA.;
- Владение Python;
- Знание SQL и опыт работы с базами данных.;
- Работа с большими языковыми моделями (LLM), понимание архитектуры и принципов работы LLM, опыт использования популярных библиотек для работы с LLM, умение выполнять тонкую настройку (fine-tuning) моделей под конкретные задачи, создание и тестирование промтов (Prompt Engineering), опыт тестирования и оптимизации промтов, оценка производительности моделей (Benchmarking), создание бенчмарков для оценки качества работы моделей, знание метрик для оценки NLP-задач;
- Знание особенностей задач NLP, опыт работы с текстовыми данными: предобработка, токенизация, лемматизация, стемминг, векторизация. Классификация, кластеризация, генерация, NER;
- Навыки работы с поисковыми системами и задачами поиска, понимание принципов работы поисковых систем, знакомство с Elasticsearch, опыт создания и оптимизации поисковых запросов, умение работать с семантическим поиском.
- Официальное трудоустройство;
- ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки;
- Современный офис (Даниловская мануфактура, м. Тульская), бесплатный спорт в собственном спортзале от «Лиги Героев»;
- Бесплатная подписка на сервисы партнеров;
- Полный день в офисе, гибридный график или 100% дистанционный формат работы;
- Льготные условия ипотеки в рамках зарплатного проекта;
- Насыщенная корпоративная жизнь.
Поделиться:
Опубликована 13 дней назад