О КОМПАНИИ

AIR (Artificial Intelligence Relations)

GenAI стартап с фокусом на разработку решений в области коммуникаций и поддержки управленческих решений. Мы разрабатываем инструменты автоматизации создания контента и аналитики больших объемов текстовых и мультимедийных данных.

Наши решения внедрены в крупных компаниях: банковский сектор, госкорпорации, телеком, государственные и муниципальные структуры, также работаем с B2C сектором.

ОПИСАНИЕ ДОЛЖНОСТИ

Вакансия подойдет обучающимся 3-4 курса, на специальность Информатика и вычислительная техника, Прикладная математика и информатика, Инженерия искусственного интеллекта и смежных направлений на позицию Junior AI/LLM Engineer.

Вы будете работать над:

Интеграцией и развертыванием крупных языковых моделей (LLM) через API и self-hosted версии
Разработкой многоагентных систем (agentic AI) на современных фреймворках
Оптимизацией и квантованием моделей для production-среды
Разработкой RAG-систем (Retrieval-Augmented Generation) для интеграции с корпоративными данными
Реализацией мультимодальных решений (текст + изображения + видео)
Разработкой и улучшением промпт-инженерии для специфических задач компании
Оптимизацией и ускорением вывода моделей на GPU
Fine-tuning локальных моделей под задачи компании

ТРЕБОВАНИЯ

Обязательные:

Свободное владение Python (ООП, async/await, type hints, работа с библиотеками)
Практический опыт работы с LLM через API (OpenAI, Anthropic, Google AI Studio и т.п.) или локально
Базовое понимание архитектуры трансформеров и нейронных сетей
Владение Git и GitHub для работы в команде
Чтение технической документации на английском языке (B1 и выше)

Желательные навыки:

Agentic AI Frameworks:

- LangGraph

- LangChain

- AutoGen

Deep Learning Framework:

- PyTorch

- HuggingFace Transformers

RAG и Retrieval:

- LlamaIndex или Haystack

- Векторные БД: FAISS, Pinecone, Weaviate, Chroma

- Embedding models и reranking

GPU & Optimization:

- Квантование моделей (4-bit QLoRA, INT8, FP8)

- CUDA basics (для оптимизации kernel’ов)

- Flash-Attention

- Model inference optimization

Backend & DevOps:

- FastAPI (для production API)

- Docker (контейнеризация)

- Kubernetes (бонус)

- REST API, Webhooks, OAuth

Data & ML:

- Pandas, NumPy (обработка данных)

- SQL (запросы к данным)

- scikit-learn (для ML preprocessing)

УСЛОВИЯ РАБОТЫ

Зарплата и оформление:

Зарплата: ~ 170 000 рублей в месяц (оплата на руки)
Зарплата обсуждается индивидуально в зависимости от опыта и уровня подготовки
Оформление: по ТК

Формат работы:

Локация: Москва, ул. Поклонная, д. 3, корп. 4
Формат: Гибридный (возможна удаленная работа)
Время: От 30 часов в неделю (возможно совмещение с учебой в т.ч.)
Начало: Возможный старт через 1-2 недели после согласования

Предоставляется:

Собственные GPU-серверы для экспериментов (VRAM: 48GB+)
Доступ ко всем коммерческим LLM API (OpenAI GPT-4o, Anthropic Claude 4, Google Gemini 2.5, Mistral, Grok, GigaChat)
Лицензионное ПО и инструменты для разработки
Оборудование (ноутбук при необходимости)

Дополнительные условия:

Гибкий график (понимание студенческих обязательств)
Менторство от опытных специалистов в области AI
Участие в профессиональных конференциях и мероприятиях
Возможность работы над собственными идеями (25% времени на R&D инициативы)
Развитие в направлении Forward-Deployed Engineer
Быстрый рост Junior → Mid-level за 6-12 месяцев

Младший разработчик R&D AI (Junior AI/LLM Engineer)

до 170 000 ₽

О КОМПАНИИ

ОПИСАНИЕ ДОЛЖНОСТИ

ТРЕБОВАНИЯ

УСЛОВИЯ РАБОТЫ

Вакансия в подборках

Похожие вакансии