Middle AI Developer / Разработчик ИИ

По договоренности

  • Октябрьская
  • Шаболовская
  • Ленинский проспект

Ищем разработчика middle-уровня для работы над внутренними AI-сервисами компании с фокусом на текстовые модели и RAG-системы. Основная задача — разработка и интеграция интеллектуальных чат-ботов для консультации пользователй, систем поддержки продаж, аналитики на основе больших текстовых данных.

Основные проекты:

- Разработка мультиагентной RAG-систем для ботов поддержки сотрудников

- Интеграция LLM в корпоративные приложения

- Создание систем аналитики на больших текстовых датасетах

Особенности позиции:

- Интеграция моделей, выбранных data scientists, в готовые продукты

- Критически важны умение оптимизировать быстродействие и стоимость при сохранении уровня качества решений

- Работа с большими текстовыми датасетами и векторными базами данных

- Работа как с внешними провадерами LLM, так и с внутренними сервисами.

Обязанности:

Текстовые модели и RAG-системы (основной фокус)

- Разработка мультиагентных RAG-систем для ответов на вопросы пользователей и сотрудников

- Интеграция LLM в чат-боты и корпоративные приложения

- Prompt engineering и оптимизация запросов к LLM API (батчинг, кэширование, параллезация запросов)

- Работа с моделями эмбеддеров, использование LLM как реранкеров

- Работа с векторными базами данных (Qdrant, Chroma)

- Работа с графовыми базами знаний (GraphRAG + Neo4j)

- Создание pipeline для аналитики на больших текстовых датасетах

- Обработка текста: токенизация, нормализация, очистка, работа с большими объемами данных

- Оценка качества решений: настройка метрик релевантности и точности ответов

Интеграция и развертывание

- Создание API endpoints (FastAPI, Flask) для развертывания ML-моделей

- Разработка собственных workflow агентных систем для интеграции моделей в продукты

- Оптимизация пайплайна обработки данных с учетом быстродействия и стоимости

- Настройка мониторинга производительности и качества моделей в продакшене

- Работа с арендованными GPU-серверами для развертывания моделей

- Асинхронное программирование для обработки больших объемов параллельных запросов

Бонусные направления (желательно, но не обязательно)

-Компьютерное зрение: интеграция моделей детекции объектов, работа с Vision-Language Models (VLM), около-реалтайм обработка видео-потоков

-Обработка речи: батчевая обработка аудио-записей, разработка голосовых интерфейсов (TTS+STT), анализ качества звонков

Требования:

Обязательные навыки

Текстовые модели и RAG (основной фокус):

- Опыт работы с Hugging Face Transformers, LangChain (или аналогичными фреймворками)

- Понимание работы с LLM, их настроек и принципов выбора

- Опыт разработки RAG (Retrieval-Augmented Generation) архитектур

- Prompt engineering и оптимизация запросов к LLM API

- Работа с embeddings: создание, сравнение, поиск похожих текстов

- Работа с векторными базами данных: Milvus, FAISS, Chroma

- Работа с графовыми базами знаний: GraphRAG, Neo4j

- Обработка текста: токенизация, нормализация, очистка

- Работа с большими текстовыми датасетами для анализа и предиктивной аналитики

- Понимание метрик качества для RAG-систем (recall@k, accuracy, faithfulness и т.д.)

- Понимание особенностей Guardrails

- Знание Structured Output и умение выстраивать workflow на их основе, применение Schema-guided reasoning и иных подходов

Data Science:

- Python: middle-уровень (pandas, numpy, scipy)

- Работа с данными: загрузка, очистка, предобработка, EDA

- Понимание базовых концепций ML: обучение/валидация/тестирование

- Понимание особенностей работы с временными рядами

- Визуализация данных (matplotlib, seaborn, plotly)

- Базовое понимание статистики и теории вероятности

- Понимание метрик для различных классов задач (accuracy, precision, recall, F1, recall@k и т.д.)

- Умение балансировать производительность, стоимость и качество

- Понимание микросервисной архитектуры

Интеграция и развертывание:

- Создание API для ML-моделей: FastAPI, Flask, REST API

- Работа с базами данных: SQL (PostgreSQL) - средний уровнеь

- NoSQL (MongoDB), графовые базы (Neo4j) - базовый уровень

- Асинхронное программирование: asyncio, aiohttp

- Базовое понимание веб-разработки

- Разработка собственных workflow для интеграции моделей в продукты

- Работа с арендованными GPU-серверами

Опыт работы:

- 2-3 года коммерческого опыта разработки с использованием ML/AI

- Наличие реальных проектов с RAG-системами или интеграцией LLM

- Опыт работы в команде: понимание процессов разработки, code review, git workflow

- Опыт работы по Agile

- Опыт интеграции ML-решений в продукты

Soft Skills:

- Практичность: умение выбирать подходящие под задачу инструменты

- Самостоятельность: способность находить решения под потребности бизнеса

- Аналитическое мышление: умение разбираться в проблемах и дебажить проблемы в workflow c LLM

- Коммуникация: способность объяснять технические решения нетехническим коллегам

- Гибкость: способность переключаться между различными проектами

Желательные навыки (бонусы)

Текстовые модели: (бонус)

- Fine-tuning языковых моделей с Unsloth

- Опыт работы с библиотеками: PyTorch, TensorFlow, ONNX Runtime, vLLM

- Опыт работы с омни-моделями

Компьютерное зрение (бонус):

- Опыт работы с OpenCV, Roboflow

- Опыт работы с Yolo, CLIP и аналогами

- Обработка видео: форматы, кодеки, стриминг (около-реалтайм)

- Детекция объектов, трекинг, сегментация

- Понимание работы с Vision-Language Models (VLM)

- Понимание архитектур: ResNet, EfficientNet, Vision Transformers

- Работа с видео-стримами в реальном времени

Обработка речи (бонус):

- Работа с STT - Whisper, RIVA, Omnilingual ASR

- Синтез речи (TTS), опыт с Silero и аналогичными генераторами

- Обработка аудио: librosa, soundfile, pydub

- Батчевая обработка аудио

Условия:

- Работа в команде с датасаентистами и аналитиками

- Работа по методологии Agile

- Работа с арендованными GPU-серверами

- Возможность карьерного роста до техлида

- Возможность развития в сторону MLOps

- Внутрикорпоративное обучение

Ключевые навыки

Python, Machine Learning, Natural Language Processing, RAG, LangChain, Hugging Face, LLM, GPT, BERT, T5, Prompt Engineering, Embeddings, Vector Databases, Qdrant, Chroma, GraphRAG, Neo4j, FastAPI, Flask, PostgreSQL, MongoDB, Deep Learning, Fine-tuning, Data Science, MLOps, API Development, Optimization, Agile, vLLM, Unsloth, Computer Vision, OpenCV, YOLO, Video Processing, Speech Recognition, Whisper, ASR, TTS, GPU


Адрес: Россия, Москва, улица Ефремова, 10к1
Показать на большой карте

Поделиться:

Опубликована месяц назад

Похожие вакансии

Ищем специалиста, который умеет писать и поддерживать различные скрипты и автоматизации, интегрировать сервисы между собой и создавать ботов под задачи проекта. Нужен человек, который понимает, как собрать рабочую систему из разных модулей и сервисов...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 1 года
Логотип компании ДИАМАНТ ВИЖНДИАМАНТ ВИЖН
  • Москва
13 часов назад
R-Style Softlab — российская IT-компания, системный интегратор, разработчик программных, сервисных продуктов для банковской сферы, финансового рынка и АПК, входящая в группу Россельхозбанка. С 1994 года делаем сложные операционные процессы удобными д...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании R-Style Softlab (Эр-Стайл Софтлаб)R-Style Softlab (Эр-Стайл Софтлаб)
  • Москва
13 часов назад
Привет! Мы — команда Decart IT, предлагаем познакомиться. Разрабатывать лучшие инструменты для того, чтобы каждый человек был на своем месте - главная миссия нашей команды! Decart IT — сервисно-продуктовая компания с фокусом на IT-аутстаффинге и запу...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Decart IT-productionDecart IT-production
  • Москва
12 часов назад
ООО "ВиаМоби" - группа компаний, занимающихся разработкой и поддержкой мобильных сервисов для операторов связи в РФ и СНГ. Мы создаем инновационные и хорошо спроектированные продукты, которыми пользуются уже более 7 000 000 пользователей. Вместе с ро...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ВиаМобиВиаМоби
  • Москва
13 часов назад
от 200 000 ₽
Выше средней на 33%
Погрузитесь в мир высоких технологий и станьте частью команды, создающей инновационные решения на языке Go. Обязанности Разработка и поддержка серверных приложений на Golang Оптимизация и рефакторинг существующего кода Участие в проектировании архите...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Кучеров РостиславКучеров Ростислав
  • Москва
6 часов назад
Lovit - оператор цифровых сервисов. Среди наших услуг - проводной и беспроводной интернет, кабельное и интерактивное телевидение, телефония и другие полезные сервисы для людей и бизнеса. Оказываем услуги в Москве, Московской области и Санкт-Петербург...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ПИК-специализированный застройщикПИК-специализированный застройщик
  • Москва
13 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.