Биоинформатик (WGS / GWAS / Селекционная геномика)

По договоренности

  • Марксистская
  • Третьяковская
  • Маяковская

Требуется специалист для выполнения комплексного биоинформатического анализа данных полногеномного секвенирования (WGS) сельскохозяйственных культур (пшеница, рапс, подсолнечник) с последующим формированием ДНК-маркерных панелей и моделированием селекционных стратегий.

Проект охватывает полный цикл — от обработки сырых данных до рекомендаций по схемам скрещивания.

🧪 Задачи

1. Первичная обработка NGS-данных

  • Контроль качества (QC), тримминг и фильтрация ридов
  • Картирование на референсный геном
  • Вызов вариантов (SNP, InDel) с учетом полиплоидности
  • Фильтрация VCF (динамические параметры)
  • Расчет статистик картирования
  • Функциональная аннотация вариантов

2. Импутация генотипов

  • Импутация с использованием:
    • публичных референсных панелей (при наличии)
    • или внутри выборки

3. Популяционная генетика

  • Расчет наблюдаемой гетерозиготности
  • PCA (PC1–PC10)
  • Матрицы генетических дистанций и родства
  • Admixture-анализ
  • Филогенетическое дерево (bootstrap ≥ 1000)
  • Комплексная интерпретация структуры популяции

4. GWAS-анализ

  • Проведение GWAS с использованием ≥10 моделей
    • линейные
    • смешанные
    • мультилокусные
  • Учет популяционной структуры (PC 2–20)
  • Подбор метода коррекции множественного тестирования
  • LD-анализ (параметры подбираются индивидуально)
  • Формирование списка значимых ассоциаций
  • Работа с признаками без значимых ассоциаций (top SNP / корректировка порога)

5. Селекционная аналитика

  • Формирование панели ДНК-маркеров
  • Валидация панели:
    • кросс-валидация
    • независимая выборка (при наличии)
    • сопоставление с QTL
  • Ранжирование образцов:
    • по отдельным признакам
    • по комплексному индексу
  • Моделирование скрещиваний:
    • все комбинации (♀ × ♂)
    • прогноз потомства (genomic prediction + сегрегация маркеров)
  • Разработка селекционных схем:
    • возвратные
    • трехлинейные и др.

🌱 Объекты анализа

  • Пшеница мягкая (гексаплоид, ~16 Gb, 350–400 образцов)
  • Рапс (яровой и озимый, ~1.13 Gb, 100–150 образцов)
  • Подсолнечник (~3.6 Gb, 100–150 образцов)

📥 Входные данные

  • WGS (PE150, ≥20×), FASTQ
  • Фенотипы (≥2 признаков, ≥2 локаций, мультигодовые данные)

📊 Ожидаемые результаты

  • VCF (до/после фильтрации, с импутацией)
  • QC-отчеты
  • PCA-графики, Manhattan и QQ plots
  • Матрицы дистанций и родства
  • Филогенетические деревья
  • Таблицы ассоциаций
  • Панели ДНК-маркеров
  • Ранжирование образцов
  • Матрицы скрещиваний
  • Рекомендации по селекционным стратегиям

🧠 Требования

  • Опыт работы с NGS/WGS данными
  • Уверенное владение инструментами:
    • BWA / Bowtie2
    • GATK / FreeBayes / bcftools
    • PLINK / ADMIXTURE / EIGENSOFT
    • GWAS-пакеты (GEMMA, GAPIT, Tassel и др.)
  • Опыт работы с полиплоидными геномами (обязательно)
  • Знание популяционной генетики и GWAS
  • Опыт genomic prediction (желательно)
  • Навыки работы с большими данными (HPC)

➕ Будет плюсом

  • Опыт в агрогеномике / селекции растений
  • Знание QTL-анализа

Адрес: Россия, Москва
Показать на большой карте

Поделиться:

Опубликована день назад

Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.