ML Engineer

По договоренности


Мы - команда Intelligent Search, создаем поисковый сервис, который отвечает на запросы пользователей на естественном языке.

Миссия команды: Сломать барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Мы предоставляем GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы, включая вопросы о свежих новостях и событиях.

Над чем мы работаем:

- Разработка ядра поиска: Создаем и оптимизируем движок, который понимает, что именно нужно пользователю, и находит это в море данных

- Интеграция с GigaChat: Обеспечиваем бесшовную работу нашего поиска внутри основной LLM Сбера

- Мультиплатформенность: Делаем наш функционал доступным для пользователей на веб-платформе, в мессенджерах и на умных устройствах

- Решение сложных задач: Преодолеваем challenges, связанные с обработкой, структурированием и доставкой данных в формате, «удобоваримом» для языковой модели

Наша технология — это ключевой компонент, который:

- Позволяет LLM выйти за пределы датасета своего обучения

- Обеспечивает ответы, основанные на проверенных и свежих данных

В нашем проекте мы используем самые современные подходы к решению задачи Information Retrieval, проводим эксперименты по улучшению ранжирования поисковой выдачи с использованием методов машинного обучения, запускаем и анализируем результаты A/B тестов.

Если ты всегда хотел решать задачи на стыке науки и технологий, работать в области информационного поиска, заниматься не только исследовательскими задачами из области NLP, но и самостоятельно реализовывать и внедрять современные алгоритмы из свежих научных статей, то ты наш идеальный кандидат!

Стек технологий проекта: Python, OpenSearch/ElasticSearch, Transformers, PyTorch, Airflow, PostgreSQL, CatBoost, Hadoop, PySpark.

Обязанности

  • участвовать в разработке поискового движка
  • разрабатывать и оптимизировать алгоритмы и модели машинного обучения
  • обучать Transormer-based модели
  • проводить исследования и эксперименты в целях улучшения качества поиска
  • внедрять в продакшн ML решения
  • проводить A/B тесты
  • опыт работы в области NLP / ранжировании / поиске / рекомендациях от трех лет
  • хорошее знание классических структур данных и алгоритмов
  • фундаментальное понимание работы стандартных алгоритмов машинного обучения
  • опыт работы с современными языковыми моделями - трансформерами
  • уверенное владение Python на рабочем уровне
  • умение писать читаемый и поддерживаемый код.

Требования

  • опыт работы в области NLP / ранжировании / поиске / рекомендациях от трех лет
  • хорошее знание классических структур данных и алгоритмов
  • фундаментальное понимание работы стандартных алгоритмов машинного обучения
  • опыт работы с современными языковыми моделями - трансформерами
  • уверенное владение Python на рабочем уровне
  • умение писать читаемый и поддерживаемый код.

Будет плюсом:

  • опыт работы с ElasticSearch, OpenSearch или другим поисковым движком как с поисковым инструментом, а не хранилищем логов
  • опыт работы с Retrieval Augmented Generation
  • знание алгоритмов аппроксимированного поиска ближайших соседей
  • знание основ разработки на С++ и Java
  • опыт реализации и внедрения моделей машинного обучения
  • умение работать с платформами для краудсорса
  • знакомство с PySpark.

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 19 часов назад

Похожие вакансии

Задачи: Настройка и сопровождение рабочих мест (Windows, macOS, iOS, Android, Linux); Поддержка мобильной техники, ноутбуков, планшетов, периферии Интеграция пользовательских устройств с корпоративными ИТ-системами; Поддержка сервисов Microsoft (AD, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Управляющая компания РОСНАНОУправляющая компания РОСНАНО
  • Москва
19 часов назад
до 250 000 ₽
Выше средней на 31%
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ : Data Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
2 дня назад
до 220 000 ₽
Выше средней на 15%
... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer. ... НАШИ ОЖИДАНИЯ ОТ УСПЕШНОГО КАНДИДАТА: Опыт работы в роли data engineer ≈ 5 лет (Обязательно); Опыт работы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
7 дней назад
до 150 000 ₽
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
13 дней назад
Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... премии Драйвовые задачи и ресурсы для их реализации Гибридный формат работы Преимущества аккредитованной it-компании ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
19 часов назад
Международная продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных ... крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках QA Engineer ...
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Москва
19 часов назад

Похожие вакансии

до 250 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
до 220 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
до 150 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.