Младший разработчик R&D AI (Junior AI/LLM Engineer)
до 170 000 ₽
- Спортивная
- Киевская
- Парк Победы
О КОМПАНИИ
AIR (Artificial Intelligence Relations)
GenAI стартап с фокусом на разработку решений в области коммуникаций и поддержки управленческих решений. Мы разрабатываем инструменты автоматизации создания контента и аналитики больших объемов текстовых и мультимедийных данных.
Наши решения внедрены в крупных компаниях: банковский сектор, госкорпорации, телеком, государственные и муниципальные структуры, также работаем с B2C сектором.
ОПИСАНИЕ ДОЛЖНОСТИ
Вакансия подойдет обучающимся 3-4 курса, на специальность Информатика и вычислительная техника, Прикладная математика и информатика, Инженерия искусственного интеллекта и смежных направлений на позицию Junior AI/LLM Engineer.
Вы будете работать над:
- Интеграцией и развертыванием крупных языковых моделей (LLM) через API и self-hosted версии
- Разработкой многоагентных систем (agentic AI) на современных фреймворках
- Оптимизацией и квантованием моделей для production-среды
- Разработкой RAG-систем (Retrieval-Augmented Generation) для интеграции с корпоративными данными
- Реализацией мультимодальных решений (текст + изображения + видео)
- Разработкой и улучшением промпт-инженерии для специфических задач компании
- Оптимизацией и ускорением вывода моделей на GPU
- Fine-tuning локальных моделей под задачи компании
ТРЕБОВАНИЯ
Обязательные:
- Свободное владение Python (ООП, async/await, type hints, работа с библиотеками)
- Практический опыт работы с LLM через API (OpenAI, Anthropic, Google AI Studio и т.п.) или локально
- Базовое понимание архитектуры трансформеров и нейронных сетей
- Владение Git и GitHub для работы в команде
- Чтение технической документации на английском языке (B1 и выше)
Желательные навыки:
Agentic AI Frameworks:
- LangGraph
- LangChain
- AutoGen
Deep Learning Framework:
- PyTorch
- HuggingFace Transformers
RAG и Retrieval:
- LlamaIndex или Haystack
- Векторные БД: FAISS, Pinecone, Weaviate, Chroma
- Embedding models и reranking
GPU & Optimization:
- Квантование моделей (4-bit QLoRA, INT8, FP8)
- CUDA basics (для оптимизации kernel’ов)
- Flash-Attention
- Model inference optimization
Backend & DevOps:
- FastAPI (для production API)
- Docker (контейнеризация)
- Kubernetes (бонус)
- REST API, Webhooks, OAuth
Data & ML:
- Pandas, NumPy (обработка данных)
- SQL (запросы к данным)
- scikit-learn (для ML preprocessing)
УСЛОВИЯ РАБОТЫ
Зарплата и оформление:
- Зарплата: ~ 170 000 рублей в месяц (оплата на руки)
- Зарплата обсуждается индивидуально в зависимости от опыта и уровня подготовки
- Оформление: по ТК
Формат работы:
- Локация: Москва, ул. Поклонная, д. 3, корп. 4
- Формат: Гибридный (возможна удаленная работа)
- Время: От 30 часов в неделю (возможно совмещение с учебой в т.ч.)
- Начало: Возможный старт через 1-2 недели после согласования
Предоставляется:
- Собственные GPU-серверы для экспериментов (VRAM: 48GB+)
- Доступ ко всем коммерческим LLM API (OpenAI GPT-4o, Anthropic Claude 4, Google Gemini 2.5, Mistral, Grok, GigaChat)
- Лицензионное ПО и инструменты для разработки
- Оборудование (ноутбук при необходимости)
Дополнительные условия:
- Гибкий график (понимание студенческих обязательств)
- Менторство от опытных специалистов в области AI
- Участие в профессиональных конференциях и мероприятиях
- Возможность работы над собственными идеями (25% времени на R&D инициативы)
- Развитие в направлении Forward-Deployed Engineer
- Быстрый рост Junior → Mid-level за 6-12 месяцев
Опубликована 2 дня назад