Middle Data Scientist

По договоренности

  • Приморская
  • Василеостровская
  • Горный институт

Привет! Мы, команда лаборатории прикладного искусственного интеллекта в ФИЦ РАН, создаем решения, объединяющие фундаментальные исследования, образование и индустрию. Работаем совместно с внешними командами, в том числе из Сбера и РАНХиГС. Ищем коллегу на позицию младшего графического дизайнера для работы над представлением наших решений.

ЗАДАЧИ:

  • Работать с LLM и RAG: Разрабатывать и внедрять подходы по улучшению качества ответов языковых моделей за счет retrieval-augmented generation. Оптимизировать стратегии поиска и реранжирования.

  • Создавать интеллектуальных агентов: Проектировать и реализовывать агентов на современных фреймворках (Pydantic AI, LangGraph).

  • Решать классические NLP-задачи: Извлечение и связывание именованных сущностей (NER/NEL) из неструктурированных русскоязычных текстов.

  • Моделировать: Обучать и оценивать классификаторы и ранжирующие модели, обеспечивая их стабильную работу в продакшене.

  • Анализировать данные и качество: Проводить глубокую оценку качества ML-пайплайнов, выдвигать и проверять гипотезы по улучшению метрик. Готовить данные и признаки для обучения моделей.

ТРЕБОВАНИЯ:

  • Обязательно наличие профильного высшего образования
  • Уверенный Python (ООП, API, чистый код) и SQL (sqlalchemy/alembic).

  • Сильные NLP-навыки и опыт работы с русским текстом: решение задач NER/NEL, понимание морфологии и синтаксиса.

  • Опыт построения LLM-агентов на современных фреймворках (LangGraph, Pydantic AI или аналоги).

  • Понимание retrieval-подходов (RAG, семантический поиск) и опыт работы с векторными БД.

  • Хорошее понимание ML: классификация, ранжирование, метрики, подготовка признаков.

БУДЕТ ПЛЮСОМ:

  • Опыт файн-тюнинга/инференса BERT / RoBERTa, работа с GigaChat.

  • Знакомство с ELK и современными архитектурами LLM (MoE/Dense).

НАШ СТЕК:

  • NLP: Natasha, Pymorphy, DeepPavlov, Transformers

  • Агенты и пайплайны: Pydantic AI, LangGraph

  • Backend / Data: SQLAlchemy, Alembic

УСЛОВИЯ:

  • Работа в офисе, возможен гибрид
  • Обсуждаемая заработная плата

Адрес: Россия, Санкт-Петербург, 14-я линия Васильевского острова, 39
Показать на большой карте

Поделиться:

Опубликована 24 дня назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Мы разрабатываем инновационную платформу на основе генеративного искусственного интеллекта (GenAI), предназначенную для автоматизации создания маркетингового контента и комплексного управления коммуникационными кампаниями. Основной целью нашего проду...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Санкт-Петербург
10 дней назад
... рейтинге hh.ru, приглашает в команду управления процессного анализа и развития клиентского сервиса Data ... Scientist.
  • Полный день
  • Опыт от 1 года
Логотип компании Банк Санкт-ПетербургБанк Санкт-Петербург
  • Санкт-Петербург
месяц назад
... сложных решений для анализа больших объемов транзакционных данных, используя передовые технологии Big Data ... Мы ожидаем: опыт в роли data инженера от 2 лет опыт разработки и поддержки инфраструктурных решений на ...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Санкт-Петербург
3 дня назад
Колл Солюшенс – компания клиентской поддержки бизнеса, продаж и развития регионов на международных рынках IT и финансовых технологий. Работаем с клиентами из 10 стран, услуги предоставляем на их родном языке. Ищем в команду Аналитика данных, основным...
  • Полный день
  • Опыт от 1 года
Логотип компании Колл СолюшенсКолл Солюшенс
  • Санкт-Петербург
4 дня назад
Сегодня мы открываем поиск +1 Data-инженера в команду продуктовой аналитики (1 Data-инженер, 5 Data-аналитиков ...
  • Полный день
  • Опыт от 1 года
Логотип компании Дом.руДом.ру
  • Санкт-Петербург
10 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.