Middle AI/ML engineer (Python)
По договоренности
- Козья слобода
- Кремлевская
- Площадь Тукая
Технократия цифровизирует бизнес: от небольших компаний до крупных корпораций. СИБУР Диджитал, Камаз Digital, Татнефть, Университет Иннополис — наши клиенты. А ещё внутренние продукты, которые мы выводим на рынок.
= Ищем в нашу команду AI/ML-инженера на проект зарубежного финтеха =
Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.
Чем предстоит заниматься:
-
Разрабатывать LLM routing и gateway слой;
-
Реализовывать и оптимизировать RAG-пайплайны;
-
Встраивать guardrails и AI safety механизмы;
-
Интегрировать LLM observability и трейсинг;
-
Оптимизировать inference по latency, throughput и стоимости;
-
Реализовывать evaluation-пайплайны качества ответов;
-
Работать с GPU-инфраструктурой и масштабированием.
Что мы ожидаем:
-
Опыт AI Engineering или MLOps от 3 лет;
-
Продуктовый опыт работы с LLM;
-
Глубокое понимание RAG-архитектур;
-
Уверенная работа с Python и async-стеком;
-
Понимание рисков и безопасности LLM-систем.
Будет плюсом:
-
Agentic RAG и multi-agent системы;
-
Fine-tuning моделей (LoRA, QLoRA);
-
Multi-modal модели (vision, audio);
-
ASR, TTS, OCR, NER;
-
Опыт evaluation-фреймворков (RAGAS, deepeval);
-
Оптимизация inference (batching, KV-cache, quantization).
У нас всё прозрачно:
-
Работа над продуктом в классной команде, всё официально;
-
Топовая техника при трудоустройстве;
-
Аккредитованная ИТ-компания, наши сотрудники могут пользоваться всеми преимуществами этого статуса;
-
ДМС после испытательного срока;
-
Нетоксичная и амбициозная атмосфера;
-
Культура наставничества. Продвигайся вверх бок о бок с лучшими — наши руководители направлений признанные эксперты в профессиональном сообществе, ты тоже можешь быть одним из них;
-
Индивидуальные планы развития и карты знаний для прогнозируемого карьерного роста;
-
Участие в известных конференциях за счёт компании;
-
Современный стек;
-
Поддержка ваших технических инициатив;
-
Возможность работать удаленно или гибридно.
Опубликована 15 часов назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Казань
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Казань
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Казань