AI Engineer

По договоренности


Обязанности:
  • Разработка production NLP/LLM-решений: поиск, классификация, извлечение, суммаризация, Q&A/ассистенты.
  • Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, контракты инструментов, обработка ошибок, управление контекстом/состоянием.
  • Реализация knowledge Q&A / RAG: подготовка данных, индекс/поиск, эмбеддинги, reranking, grounding/цитирование, контроль качества.
  • Интеграция в корпоративную среду: сервисы и API, внутренние API/БД, очереди/воркеры, фоновые задачи.
  • Эксплуатация и улучшение: логи/метрики/трейсы, диагностика, регрессии качества/производительности.
  • Оптимизация инференса: latency/throughput, лимиты/контекст, кэширование/батчинг, квантование.
  • Опционально: адаптация под домен (PEFT/LoRA/QLoRA) с оценкой
Требования:
  • Образование: высшее техническое / ИТ.
  • Опыт: 3–5 лет разработки и поддержки production-сервисов в области NLP/LLM.
  • LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
  • RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
  • Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
  • Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
  • Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
  • Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.

Будет Плюсом:

  • Langfuse или аналоги (on-prem): трассировка/метрики/eval.
  • LiteLLM или аналоги: gateway/router, маршрутизация, лимиты.
  • OpenWebUI или аналоги: интеграция с retrieval/RAG и логированием.
  • Workflow orchestration: Temporal / Airflow / Prefect / Dagster / Argo; принципы идемпотентности, ретраев/таймаутов, зависимостей шагов, long-running процессов, сигналов/HITL, наблюдаемости выполнения.
  • MCP (Model Context Protocol): подключение инструментов по протоколу, контракт инструментов, безопасность/изоляция, наблюдаемость вызовов.
  • Self-hosted inference/serving: vLLM / TGI / Triton или аналоги; оптимизации GPU-инференса.
Условия:
  • Удалённый формат работы
  • Официальное оформление по ТкРФ, белая ЗП по результатам технического собеседования;
  • График работы 5/2 с 8:30 до 17:30 по Москве;
  • Премии за эффективную работу и достижение результатов;
  • Различные программы обучения для прокачки профессиональных скиллов;
  • ДМС программа

Поделиться:

Опубликована 15 дней назад

Похожие вакансии

до 150 000 ₽
Technopeak.ae is a leading provider of IT solutions and services across the Middle East. As our Remote Support division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer to join our team. This role i...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Первый БитПервый Бит
  • Москва
9 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
день назад
The Visa Services — ведущее визовое агентство в ОАЭ 2025 года по версии World Travel Awards. Мы помогаем клиентам открывать мир без границ: оформляем визы в Шенген, США, Японию, Китай и другие страны, сочетая экспертность, скорость и высокий уровень ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Филиал The Visa Services в г. МоскваФилиал The Visa Services в г. Москва
  • Москва
день назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
4 дня назад
Эта вакансия – участник пилота по использованию AI. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающи...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
день назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.