Разработчик на С++ в группу разработки YQL over YT

По договоренности


YTsaurus — одна из ключевых инфраструктурных систем Яндекса, которая используется для хранения и обработки данных.

Яндекс работает с эксабайтами данных, которые нужно эффективно хранить, обрабатывать и передавать между приложениями. Для этого мы создали YTsaurus — распределённую платформу, которая сочетает в себе единое хранилище и ряд инструментов для обработки данных под разные сценарии. Почти каждый сервис в Яндексе использует нашу платформу для решения своих задач. Платформа активно развивается, а исходный код выложен в опенсорс.

Внутри YTsaurus есть поддержка целого ряда SQL-диалектов, которые позволяют обращаться к данным. Один из таких диалектов — YQL. Он преобразует SQL-запросы в последовательность MapReduce-операций и/или выполняет их в движке DQ, который и предстоит развивать.

Движок DQ, в отличие от MapReduce, позволяет выполнять части запроса полностью в памяти без промежуточной материализации на диск. Это существенно сокращает накладные расходы и время, затрачиваемое на выполнение всего запроса.

Какие задачи вас ждут

Развитие гибридного режима выполнения запросов
Во время выполнения запроса объём данных часто уменьшается на каждом этапе — из-за фильтрации, пересечений и агрегаций. На определённом этапе использование MapReduce может стать избыточным. В таких случаях выгодно переключиться на выполнение оставшихся операций в движке DQ.

Пользовательский кластер DQ
Пользовательская нагрузка может быть настолько разнообразной, что сложно подобрать универсальные параметры для работы движка. Мы хотим реализовать возможность настройки пользовательского кластера DQ под конкретные сценарии и профили нагрузки.

Ускорение YQL over YT по бенчмаркам
YQL over YT в Яндексе работает на десятках тысяч машин и сотнях тысяч ядер. Нам важно постоянно искать точки для оптимизации исполнения запросов. Мы используем популярные бенчмарки для выявления возможностей улучшения производительности.

Публикации и вклад в продукт
Ваши результаты могут стать основой для публикаций, докладов и выступлений на крупных конференциях, а коммиты будут попадать в общую кодовую базу YTsaurus.

Мы ждем, что вы

  • Уверенно владеете C++ и готовы разрабатывать на нём высокопроизводительные системы
  • Понимаете, как анализировать производительность, находить узкие места, и готовы предлагать способы решения проблем
  • Знаете Python на уровне, достаточном для написания тестов

Будет плюсом, если вы

  • Имеете представление, как устроены СУБД, и участвовали в их разработке
  • Знаете один из диалектов SQL

Поделиться:

Опубликована 20 дней назад

Похожие вакансии

АО «НТЦ ИТ РОСА» — это место, где технологии встречаются с креативом и профессионализмом. Мы создаём операционные системы на базе собственного Linux-дистрибутива, развиваем инфраструктурные и облачные сервисы, системы виртуализации, а также разработа...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании НТЦ ИТ РОСАНТЦ ИТ РОСА
  • Москва
17 часов назад
120 000 - 150 000 ₽
Java-разработчик (проект сроком на 6 месяцев) О компании: Core — это динамично развивающаяся IT-компания, специализирующаяся на предоставлении аутстаффинговых решений для банковского и корпоративного сектора. Мы сотрудничаем с крупными банками и техн...
  • Можно удаленно
  • Подработка
  • Опыт от 3 лет
Логотип компании CORECORE
  • Москва
2 дня назад
Мы – РТК ИТ, федеральная компания с подразделениями в 7 субъектах РФ. Мы занимаемся полным циклом разработки программных продуктов, направленных на развитие и повышение эффективности бизнеса группы компаний «Ростелеком». Наши ИТ-решения, отвечают сов...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
  • Москва
2 дня назад
С 1997 года команда «Ренессанс страхование» помогает нашим клиентам — таким же людям, как и мы сами — в сложных ситуациях. Мы прошли путь от классической страховой компании до компании InsurTech, которая цифровизирует процессы на всем пути клиента и ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Ренессанс cтрахование, ГруппаРенессанс cтрахование, Группа
  • Москва
2 дня назад
Проектный офис реинжиниринга архитектуры цифровых решений государственных сервисов Обязанности: Разработка и поддержка серверной части приложений на Kotlin, Java (8, 11, 17) Реверс-инжиниринг существующей кодовой базы Проектирование архитектуры и опт...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РостелекомРостелеком
  • Москва
3 дня назад
Обязанности: Полный цикл разработки мобильного full-stack приложения: от UI на Android до проектирования и поддержки внутренней серверной логики внутри самого приложения; Разработка, поддержка и оптимизация существующего Android-приложения на Kotlin;...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ФармстандартФармстандарт
  • Москва
3 дня назад

Похожие вакансии

Логотип компании НТЦ ИТ РОСАНТЦ ИТ РОСА
120 000 - 150 000 ₽
Логотип компании CORECORE
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
Логотип компании Ренессанс cтрахование, ГруппаРенессанс cтрахование, Группа
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.