LLM инженер
По договоренности
- Динамо
- Белорусская
- Маяковская
О проекте:
Мы создаем интуитивно понятное и современное веб-приложение, которым ежедневно пользуются клиенты и юристы. Ваша задача — помочь нам сделать его еще лучше, быстрее и удобнее.
1. Основной стек
- Python & Deep Learning: Знание Python, опыт работы с PyTorch и экосистемой Hugging Face (Transformers, Datasets, Tokenizers).
- Опыт Fine-Tuning (SFT): Умение дообучать модели (Llama 3, Mistral, Qwen) на специфических юридических текстах с использованием методов эффективного обучения (PEFT, LoRA/QLoRA).
- Продвинутый RAG :
- Построение пайплайнов поиска по базе знаний.
- Понимание того, как работает Hybrid Search (векторный + полнотекстовый поиск).
- Опыт работы с Reranking-моделями (например, BGE-Reranker, Cohere) для повышения релевантности найденных документов.
- Векторные базы данных: Опыт работы с Qdrant, Weaviate, Milvus или Elasticsearch/OpenSearch.
2. Работа с данными и контекстом
- Processing Long Context: Понимание проблем длинного контекста (Lost-in-the-Middle phenomenon) и умение работать с длинными документами (chunking strategies, sliding windows).
- Data Preparation: Навыки очистки и подготовки "грязных" данных (парсинг PDF, работа с OCR-текстом, выделение структуры договора).
- Evaluation: Умение построить систему оценки качества ответов. Не просто с использованием метрик и фреймворков (Ragas, DeepEval) для проверки фактической точности (Fact Checking).
3. Настройка парсинга и баз знаний
- Понимание инструментов для извлечения данных из сложных юридических документов (многоколонная верстка, скан-копии, таблицы, рукописные подписи). Важно не просто извлечь текст, но и сохранить его семантическую структуру (заголовки, сноски, пункты договора).
- Реализация продвинутых стратегий нарезки текста, чтобы не терять контекст конкретного пункта договора в общей массе текста.
- Настройка автоматического извлечения метаданных (дата подписания, тип документа, сумма договора) Использование этих метаданных как в векторной базе данных для реализации гибридной фильтрации.
- Будет большим плюсом опыт построения графов знаний. Умение связывать разрозненные документы через общие сущности (например, связывать Допсоглашение с Основным договором через ID клиента), улучшая качество RAG.
- Опыт построения надежных и воспроизводимых пайплайнов обновления базы знаний. Обеспечение версионирования данных и обработки ошибок при парсинге.
Ключевые фокусы роли
Advanced RAG: Чтобы модель находила точные статьи закона, а не выдумывала их.
Domain Adaptation: Дообучение модели понимать юридический канцелярит и структуру документов.
Data Security: Развертывание моделей в закрытом контуре , чтобы данные клиентов не уходили в публичные API.
Адрес: Россия, Москва, Беговая улица, 2
Опубликована 2 дня назад
Похожие вакансии
от 150 000 ₽
Российская Инновационная Алюминиевая Компания «РИАК» — производитель экструзионных профилей из алюминиевых сплавов. В связи с развитием нового направления в ГК РИАК открыта вакансия специалиста по обеспечению инструментом и технологической оснасткой ...
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
ATLAS – аккредитованная ИТ-компания, специализирующаяся на создании надежных решений для хранения, обработки и передачи данных. Мы обладаем глубокой экспертизой в разработке аппаратных комплексов и предлагаем сотрудникам возможность работать над слож...
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
В крупную строительную компанию ГК Магистраль, работающую по госконтрактам Фонда Реновации г. Москвы, требуется специалист Инженер-сметчик / инженер ПТО Чем предстоит заниматься? Составление КС-2, КС-3 Ведение накопительных ведомостей по объектам (КС...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Системный интегратор (Service Workshop Engineer) Локация: Санкт-Петербург, Москва (по одному человеку в городе) Проект: Установка и тестовая эксплуатация систем медиаэкранов в метрополитене WayRay — deep-tech компания с 10-летней историей, создающая ...
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
от 120 000 ₽
Обязанности: Организация эксплуатации и своевременного ремонта энергетического оборудования Подготовка энергетического оборудования, а так же отчетной документации для предъявления инспекторам надзорных органов, для проведения технических освидетельс...
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
150 000 - 190 000 ₽
Выше средней на 6%
Строительная компания CRG - генеральный подрядчик, осуществляющий полный комплекс услуг в области строительства, проектирования и инженерного оснащения объектов высокого уровня. Главными принципами работы компании являются комплексный подход к реализ...
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
Вакансия в подборках
Похожие вакансии
от 150 000 ₽