Младший разработчик R&D AI (Junior AI/LLM Engineer)

до 170 000 ₽

Рыночная зарплата
  • Спортивная
  • Киевская
  • Парк Победы

О КОМПАНИИ

AIR (Artificial Intelligence Relations)

GenAI стартап с фокусом на разработку решений в области коммуникаций и поддержки управленческих решений. Мы разрабатываем инструменты автоматизации создания контента и аналитики больших объемов текстовых и мультимедийных данных.

Наши решения внедрены в крупных компаниях: банковский сектор, госкорпорации, телеком, государственные и муниципальные структуры, также работаем с B2C сектором.

ОПИСАНИЕ ДОЛЖНОСТИ

Вакансия подойдет обучающимся 3-4 курса, на специальность Информатика и вычислительная техника, Прикладная математика и информатика, Инженерия искусственного интеллекта и смежных направлений на позицию Junior AI/LLM Engineer.

Вы будете работать над:

  • Интеграцией и развертыванием крупных языковых моделей (LLM) через API и self-hosted версии
  • Разработкой многоагентных систем (agentic AI) на современных фреймворках
  • Оптимизацией и квантованием моделей для production-среды
  • Разработкой RAG-систем (Retrieval-Augmented Generation) для интеграции с корпоративными данными
  • Реализацией мультимодальных решений (текст + изображения + видео)
  • Разработкой и улучшением промпт-инженерии для специфических задач компании
  • Оптимизацией и ускорением вывода моделей на GPU
  • Fine-tuning локальных моделей под задачи компании

ТРЕБОВАНИЯ

Обязательные:

  • Свободное владение Python (ООП, async/await, type hints, работа с библиотеками)
  • Практический опыт работы с LLM через API (OpenAI, Anthropic, Google AI Studio и т.п.) или локально
  • Базовое понимание архитектуры трансформеров и нейронных сетей
  • Владение Git и GitHub для работы в команде
  • Чтение технической документации на английском языке (B1 и выше)

Желательные навыки:

Agentic AI Frameworks:

- LangGraph

- LangChain

- AutoGen

Deep Learning Framework:

- PyTorch

- HuggingFace Transformers

RAG и Retrieval:

- LlamaIndex или Haystack

- Векторные БД: FAISS, Pinecone, Weaviate, Chroma

- Embedding models и reranking

GPU & Optimization:

- Квантование моделей (4-bit QLoRA, INT8, FP8)

- CUDA basics (для оптимизации kernel’ов)

- Flash-Attention

- Model inference optimization

Backend & DevOps:

- FastAPI (для production API)

- Docker (контейнеризация)

- Kubernetes (бонус)

- REST API, Webhooks, OAuth

Data & ML:

- Pandas, NumPy (обработка данных)

- SQL (запросы к данным)

- scikit-learn (для ML preprocessing)

УСЛОВИЯ РАБОТЫ

Зарплата и оформление:

  • Зарплата: ~ 170 000 рублей в месяц (оплата на руки)
  • Зарплата обсуждается индивидуально в зависимости от опыта и уровня подготовки
  • Оформление: по ТК

Формат работы:

  • Локация: Москва, ул. Поклонная, д. 3, корп. 4
  • Формат: Гибридный (возможна удаленная работа)
  • Время: От 30 часов в неделю (возможно совмещение с учебой в т.ч.)
  • Начало: Возможный старт через 1-2 недели после согласования

Предоставляется:

  • Собственные GPU-серверы для экспериментов (VRAM: 48GB+)
  • Доступ ко всем коммерческим LLM API (OpenAI GPT-4o, Anthropic Claude 4, Google Gemini 2.5, Mistral, Grok, GigaChat)
  • Лицензионное ПО и инструменты для разработки
  • Оборудование (ноутбук при необходимости)

Дополнительные условия:

  • Гибкий график (понимание студенческих обязательств)
  • Менторство от опытных специалистов в области AI
  • Участие в профессиональных конференциях и мероприятиях
  • Возможность работы над собственными идеями (25% времени на R&D инициативы)
  • Развитие в направлении Forward-Deployed Engineer
  • Быстрый рост Junior → Mid-level за 6-12 месяцев

Адрес: Россия, Москва, Поклонная улица, 3к4

Поделиться:

Опубликована 2 дня назад

Вакансия в подборках

  1. Разработчик
  2. IT engineer

Похожие вакансии

  • Нестандартный график
  • Без опыта
  • Москва
18 часов назад
  • Полный день
  • Без опыта
  • Москва
19 часов назад
  • Полный день
  • Без опыта
  • Москва
11 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.