Senior AI/ML-инженер (Python)

По договоренности

  • Козья слобода
  • Кремлевская
  • Площадь Тукая

Мы создаём финтех-продукты для рынков, где формируется будущее финансовых технологий. Работаем на международных проектах, совмещая скорость стартапов с надёжностью enterprise-разработки.

У нас прозрачные процессы, честные грейды и инженерная культура без бюрократии. У нас можно создавать международный финтех, влиять на продукт и расти в предсказуемой, честной и зрелой инженерной среде.

Прямо сейчас мы в поиске AI/ML-инженера.

Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.

Чем предстоит заниматься?

  • Разрабатывать LLM routing и gateway слой;

  • Реализовывать и оптимизировать RAG-пайплайны;

  • Встраивать guardrails и AI safety механизмы;

  • Интегрировать LLM observability и трейсинг;

  • Оптимизировать inference по latency, throughput и стоимости;

  • Реализовывать evaluation-пайплайны качества ответов;

  • Работать с GPU-инфраструктурой и масштабированием.

Мы ожидаем от Вас:

  • Опыт работы от 5 лет;

  • Реальный опыт вывода ML-моделей в production и понимание жизненного цикла модели;

  • Глубокое понимание RAG-архитектур: практические навыки работы с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения);

  • Глубокое знание Python и async-стека;

  • Умение проектировать и оценивать эксперименты, работать с метриками​​​;

  • Продуктовый опыт работы с LLM;

  • Понимание рисков и безопасности LLM-систем.

Будет плюсом:

  • Agentic RAG и multi-agent системы;

  • Fine-tuning моделей (LoRA, QLoRA);

  • Multi-modal модели (vision, audio);

  • ASR, TTS, OCR, NER;

  • Опыт evaluation-фреймворков (RAGAS, deepeval);

  • Оптимизация inference (batching, KV-cache, quantization).

Почему мы?​​​​​​

  • График 5/2 по календарю РФ, гибкое начало рабочего дня до 10:00 по Московскому времени;
  • Уютный офис в центре Казани, возможность удаленной работы из других город;

  • Официальное трудоустройство в аккредитованной IT-компании со всеми плюшками;

  • Корпоративные уроки английского, фитнес прямо в офисе, футбольная команда, библиотека и партнёрские бенефиты;

  • Подарки к праздникам и здоровую атмосферу, где твой вклад ценят;

  • Поддержка профессионального развития — участие в конференциях, обучение, обмен опытом;

  • Открытая культура и высокий уровень доверия.


Адрес: Россия, Казань, Кремлёвская улица, 21А
Показать на большой карте

Поделиться:

Опубликована день назад

Похожие вакансии

Прямо сейчас мы в поиске сильного DevOps-инженера.
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании ТехнократияТехнократия
  • Казань
день назад
Ищем QA-инженера в команду тестирования нашего собственного банка.
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании OzonOzon
  • Казань
4 дня назад
250 000 ₽
Выше средней на 42%
Обязанности: организовывать разработку документации по закрепленным за ним объектам, участвует в составлении комплексных планов-графиков выполнения научно-исследовательских, проектных, конструкторских и технологических работ для объектов, на которых ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании Общество с ограниченной ответственностью Строительная компания АвтодорОбщество с ограниченной ответственностью Строительная компания Автодор
  • Казань
21 день назад
80 000 - 120 000 ₽
... работу: учитель, преподаватель, наставник, лектор, репетитор, педагог, воспитатель, учитель физики, инженер ...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 5 лет
Логотип компании Онлайн-школа ТетрикаОнлайн-школа Тетрика
  • Казань
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.