ML - инженер (СКАН)

По договоренности

  • Белорусская
  • Маяковская
  • Тверская

Интерфакс - крупнейшая в России негосударственная информационная группа, создатель передовых информационно-аналитических систем в сегменте B2B, одно из ведущих в стране и наиболее цитируемых в мире российских информационных агентств.

Компания Интерфакс один из лидеров в своей отрасли и в числе своих клиентов имеет все крупнейшие СМИ, теле- и радиоканалы, интернет СМИ, издательства, государственные и бизнес-структуры, а также игроков финансового сектора, таких как биржи и банки.

Проект СКАН – система управления репутацией и медиа-анализа. Мы помогаем PR-специалистам эффективно работать со СМИ и соцсетями, а специалистам по безопасности - оценивать репутационные риски для работы с контрагентами.

Система непрерывно собирает новости с десятков тысяч источников, разбирая ежедневно около 500000 статей. Каждая статья проходит лингвистическую обработку через несколько десятков сервисов. Мы научились понимать текст на очень высоком уровне и это только вершина айсберга. Для обеспечения процессинга, поиска, аналитики, мониторинга, шлюза на данный момент используется платформа с 300+ GHz, 5TB RAM, 65TB SSD, 6TB SQL Server, 16TB MongoDB.

Мы растем каждый год на 20% минимум - новые вызовы требуют еще больших объёмов, оптимизаций и решения сложных технических задач, обновления стека технологий.

Задачи, которые предстоит решать:

  • Организация и поддержание работы пайплайна NLP обработки текстов
  • Работа с данными на потоке и данными из DWH
  • Реализация нового функционала системы: продуктовые и технические фичи;
  • Проверка и генерация гипотез для решения задач: поиск нестандартных подходов, совершенствование существующей архитектуры;
  • Принятие участия в выборе нового инструментария;
  • Структурирование, планирование и менеджмент: начиная с себя до всего отдела;
  • Разработка масштабируемых научных и инженерных решений, которые успешно работают на производстве;
  • Работать с лидерами над разработкой стратегического видения и долгосрочных планов по улучшению лингвистического и NLP ядра продукта.

Что мы ожидаем увидеть в успешном кандидате:

  • Опыт программирования на Python (не менее 3 лет) Python 3;
  • Опыт и знания в области проектирования или архитектуры (шаблоны проектирования, надежность и масштабирование) новых и существующих систем;
  • Знания линейной алгебры, теории вероятностей и статистики;
  • Понимание принципов работы базовых ML моделей (регрессия, классификация, деревья, бустинг, кластеризация, методы восстановления пропущенных значений и т.д.);
  • Опыт использования одного из DL фреймворков (pytorch, tensorflow и т.п.);
  • Понимание принципов работы с большими данными;
  • Опыт работы с FastAPI, MLFlow/Dagster, AirFlow, Git, Docker, Jupyter Hub иные современные инфраструктурные инструменты и средства;
  • Знание алгоритмов и структур данных;

Будет плюсом:

  • Опыт построения ML конвейеров с нуля и знание плюсов и минусов разных инструментов и подходов
  • Знание и опыт инструментами работы с большими данными. Spark,Kafka, Hadoop, Clickhouse, Hive, HDFS, MinIO
  • Умение писать SQL запросы;

Что мы готовы предложить:

  • Официальное оформление с первого дня работы
  • ДМС (включая стоматологию)
  • Премии по результатам работы: квартальные, годовые
  • Удобное местоположение: офис в историческом центре Москвы (Маяковская, 1 мин. ходьбы от метро)
  • Возможность работать удаленно
  • Тренинги и обучение, участие в профессиональных конференциях и корпоративных мероприятиях

Адрес: Россия, Москва, 1-я Тверская-Ямская улица, 2
Показать на большой карте

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Обязанности: Осуществлять помощь в установке систем нивелирования; Производить запуск систем нивелирования на объекте клиента; Производить обучение персонала клиента по работе с системами нивелирования; Осуществлять техническую поддержку в рамках гар...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ХедмайнерХедмайнер
  • Москва
день назад
Что нужно делать: Осуществлять внедрение, интеграцию, конфигурирование, диагностику и эксплуатацию корпоративных WAF и других сетевых систем защиты. Разрабатывать архитектуру внедрения корпоративных WAF в корпоративную сеть. Проводить аудит внешнего ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании T2T2
  • Москва
день назад
Основная цель – разработка витрин данных и дата продуктов (операционный блок). Наш стек: Базы данных: GreenPlum, ClickHouse; ETL: Airflow, Spark, PL/pgSQL; Объектное хранилище: HDFS; Чем предстоит заниматься: Разработка, оптимизация и поддержка витри...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании АО «ОТП Банк» (JSC «OTP Bank»)АО «ОТП Банк» (JSC «OTP Bank»)
  • Москва
день назад
Сегодня мы ищем в команду Devops - инженера.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Электронная торговая площадка ГазпромбанкаЭлектронная торговая площадка Газпромбанка
  • Москва
день назад
Сейчас во «Фланте» работают 500+ человек, большая часть из которых — инженеры. ... Наши продукты закрывают для инженеров других компаний весь спектр инфраструктурных задач: от управления ... которые при этом должны быть понятными конечному пользователю и надёжно работать без вмешательства инженеров ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ФлантФлант
  • Москва
день назад
На текущий момент мы расширяем нашу команду и будем рады принять в наш коллектив DevOps-инженера.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании АЙФЭЛЛАЙФЭЛЛ
  • Москва
день назад

Похожие вакансии

Логотип компании АО «ОТП Банк» (JSC «OTP Bank»)АО «ОТП Банк» (JSC «OTP Bank»)
Логотип компании Электронная торговая площадка ГазпромбанкаЭлектронная торговая площадка Газпромбанка
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.