Data Science

По договоренности


Обязанности:
  • Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей
  • Построение решений на базе LLM моделей \ разработка промптов.
  • Суммаризация информации для генерации кода и тестов
  • Генерация кода и тестов с помощью LLM
  • Определение роли пользователя \ выделение навыков с помощью LLM
  • Генерация рекомендаций по улучшению кода пользователя с помощью LLM
  • Построение RAG сервиса базы знаний по коду и тестам
  • Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов
Требования:
  • Высшее образование (IT, техническое, математическое)
  • Уверенное владение Python, SQL
  • Хорошие знания в области теории вероятностей, математической статистики, алгоритмов машинного обучения ML \ DL (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.)
  • Знания в области NLP алгоритмов
  • Понимание деталей работы LLM и того, как происходит их дообучение и инференс
  • Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch
  • Желателен опыт работы с Langchain
  • Желателен опыт вывода ML/NLP моделей в production
  • Опыт чтения и разбора научных статьей

​​​​​​


Поделиться:

Опубликована 6 дней назад

Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.