Middle+/Senior Data Scientist в команду NLP Core

По договоренности


Привет! Мы – команда NLP Core, специализируемся на актуализации и сборе данных о компаниях. Работая с неструктурированной и сложной информацией, мы превращаем хаос данных в структурированные и качественные информационные потоки, обеспечивая высокую точность, полноту и актуальность контента в продукте. Наша работа напрямую влияет на качество сервиса и лояльность пользователей. Мы разрабатываем алгоритмические и ML-решения для автоматизации задач, применяя весь спектр инструментов NLP стека: от расстояния Левенштейна и линейных моделей до коммерческих LLM и их локальных аналогов.

Мы расширяем команду и ищем NLP-инженера которому интересно работать с большими и сложными наборами данных, развивать ML-решения, структурируя их и приводя в порядок.

Какие задачи мы решаем

  • Добыча данных – умные системы для поиска товаров, контактов, описаний и других данных, связанных с компаниями.
  • Поддержка актуальности информации о компаниях – с помощью данных и моделей проводим валидацию существующей информации о компаниях, добываем новую.
  • Категоризация товаров – автоматическая классификация товаров на основе их описаний и характеристик.
  • Модерация данных – предотвращаем публикацию нежелательных отзывов и товаров в продукте.

Наши ожидания от кандидата

  • Опыт работы с NLP-задачами 3+ лет.
  • Уверенное владение PyTorch, HF Transformers и основными библиотеками для обработки текста и ML/DL.
  • Глубокое понимание LLM: архитектуры моделей, файнтюнинга, техник улучшения качества генерации.
  • Опыт применения LLM стека:
    • низкоуровневых решений на vLLM, sglang
    • инструментов для оркустрации и интеграции LangChain, LlamaIndex.
  • Навыки применения классических, глубоких и LLM моделей.
  • Уверенные навыки разработки на Python и владение Git.
  • Готовность работать на всех этапах разработки: от анализа проблемы и проведения экспериментов до оценки решений и их реализации в виде сервисов.

Будет крутым бонусом

  • Опыт работы с CI/CD и инфраструктурой: Docker, Gitlab, Kubernetes, Kafka, FastAPI, GRPC.
  • Глубокое знание Python: multiprocessing, asyncio.
  • Навыки интеграции и деплоя ML-моделей в продуктовые серверные приложения.
  • Навыки оптимизации инференса ML/DL-моделей: distillation, pruning, ORT, Triton.

Почему стоит к нам присоединиться

  • Сложные задачи в реальном продукте — сотни тысяч организаций, горы связанных с ними данных разной степени структурированности.
  • Свобода выбирать технологии — мы используем как классические алгоритмы так и передовые ML решения.
  • Влияние на продукт — разрабатываемые нами решения улучшают пользовательский опыт в продуктах компании.
  • Сильная команда — с которой можно расти и умножать свои знания, принося общий вклад.
  • Фокус на исследования — в первую очередь мы занимаемся поиском оптимальных подходов по качеству и производительности.

Почему у нас классно

  • 2ГИС – аккредитованная IT-компания.
  • Можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске. А также коворкинги в Нижнем Новгороде, Томске, Астане, Алма-Ате.
  • Само собой, полностью белая зарплата.
  • Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента.
  • Если хочешь делиться своим опытом, мы только за — поможем с выступлениями на конференциях и статьями для Хабра/VC.
  • Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.

Поделиться:

Опубликована 25 дней назад

Похожие вакансии

Сейчас ищем Data Scientist'а, в задачи которого будет входить углубленная клиентская аналитика, создание ... Мы развиваем и поддерживаем ETL-процессы, выстраиваем Data Governance, поддерживаем BI, встраиваем ML ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Лента, федеральная розничная сетьЛента, федеральная розничная сеть
  • Москва
15 часов назад
от 350 000 ₽
Выше средней на 40%
Мы ищем опытного Data Scientist, который не только умеет работать с данными, но и понимает специфику ... Вклад в формирование стратегического roadmap компании по data-driven торговым решениям. ... Магистерская степень в области прикладной информатики, Data Science, математики, эконометрики или смежной ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании getmatchgetmatch
  • Москва
2 дня назад
Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. О команде и проектах: Команда MLE, DS, DA, MLops ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
15 часов назад
300 000 - 500 000 ₽
Выше средней на 60%
Computer Vision. Разработка и оптимизация алгоритмов для распознавания и классификации патологий на КТ-снимках. О компании Нейровижн - это инновационная компания, специализирующаяся на разработке и интеграции передовых продуктов и решений в области к...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании НЕЙРОВИЖННЕЙРОВИЖН
  • Москва
2 дня назад
Медиалогия занимается разработкой продуктов по сбору и анализу данных из СМИ и соцмедиа. Мы разрабатываем высоконагруженные системы, которые в режиме реального времени сканируют весь текстовый сегмент Интернета (100+ млн. сообщений в сутки, 1.7 млрд....
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МедиалогияМедиалогия
  • Москва
2 дня назад
Находимся в поиске Data Scientist NLP Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс ... Поддержка, мониторинг и улучшение качества NLP-моделей после деплоя Нам важны: - Опыт работы в роли Data ... scientist от 2 лет; - Работа с одним из фреймворков PyTorch/TensorFlow; - Реализация и работа с RAG ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
  • Москва
5 дней назад

Похожие вакансии

Логотип компании Лента, федеральная розничная сетьЛента, федеральная розничная сеть
от 350 000 ₽
Логотип компании getmatchgetmatch
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
300 000 - 500 000 ₽
Логотип компании НЕЙРОВИЖННЕЙРОВИЖН
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.