Data Scientist (RAG Systems) — Middle+ / Senior

По договоренности


Data Scientist (RAG Systems) — Middle+ / Senior

Направление: LLM / NLP / Information Retrieval

Формат: удалёнка

ЗП: $4000

Технологический стек: Python

Чем предстоит заниматься

• Проектировать и улучшать многоступенчатые RAG-пайплайны: retriever → reranker → generator

• Экспериментировать с чанкингом, эмбеддингами и векторными БД (Weaviate, Qdrant, FAISS) — включая гибридный поиск (BM25 + vector)

• Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG

Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking)

• Оценивать качество системы: Recall@K, MRR, NDCG, faithfulness, answer relevance, citation accuracy, A/B-тесты

• Работать с LLM: промпт-инжиниринг, извлечение структурированной информации из документов; при необходимости fine-tuning / LoRA

• Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу

• Строить data pipelines для инжеста, парсинга и обогащения корпуса документов

Мы ожидаем

3+ года практического опыта в NLP/IR и портфолио с RAG/LLM-проектами

Уверенное владение Python

Глубокое понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы

Опыт с векторными индексами и настройкой поиска (HNSW, IVF, фильтрация по метаданным)

Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge)

Чтобы мы рассмотрели ваш отклик пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.


Поделиться:

Опубликована 21 день назад

Похожие вакансии

Сейчас у нас открыта вакансия Data Scientist. ... инженерами для внедрения моделей Поддержка и доработка существующих решений Требования: Опыт работы в Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Синьор СофтСиньор Софт
  • Москва
5 дней назад
МЫ В ПОИСКЕ DATA SCIENTIST Стек команды: SQL (PosgreSQL, Greenplum), Python, Airflow, MLflow, Spark, ... ДЛЯ НАС ЦЕННО: Опыт работы в Data Science от 3 лет; Уверенное владение Python и SQL (написание чистого ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
  • Москва
5 дней назад
Чем предстоит заниматься: Построение и валидация моделей: Разработка линейных и ML-моделей для оценки кредитных и иных видов рисков. Внедрение моделей: Интеграция разработанных решений в существующие бизнес-процессы и системы. Портфельный менеджмент ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании «UZUM TECHNOLOGIES»«UZUM TECHNOLOGIES»
  • Москва
5 дней назад
Сейчас мы находимся в поиске Data Scientist, который поможет нам в разработке новых прогнозных моделей ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Студия КефирСтудия Кефир
  • Москва
5 дней назад
Задачи: Разработка production NLP/LLM-решений: AI Code Assistant (Co-Pilot), AI Chat, Agents. Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, обработка ошибок, управление контекстом/состоянием. Интеграция ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании YADROYADRO
  • Москва
5 дней назад
НАШИ ОЖИДАНИЯ ОТ КАНДИДАТА: Опыт работы от 3-х лет в области Data Science; Знание мат. статистики и теории ... Scikit-learn, pandas, numpy, scipy, Catboost, XGBoost; Уверенное написание SQL-запросов; Знание Big Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РСХБ-ИнтехРСХБ-Интех
  • Москва
4 дня назад

Похожие вакансии

Логотип компании Синьор СофтСиньор Софт
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
Логотип компании «UZUM TECHNOLOGIES»«UZUM TECHNOLOGIES»
Логотип компании Студия КефирСтудия Кефир
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.