Биоинформатик (WGS / GWAS / Селекционная геномика)
По договоренности
- Марксистская
- Третьяковская
- Маяковская
Требуется специалист для выполнения комплексного биоинформатического анализа данных полногеномного секвенирования (WGS) сельскохозяйственных культур (пшеница, рапс, подсолнечник) с последующим формированием ДНК-маркерных панелей и моделированием селекционных стратегий.
Проект охватывает полный цикл — от обработки сырых данных до рекомендаций по схемам скрещивания.
🧪 Задачи
1. Первичная обработка NGS-данных
- Контроль качества (QC), тримминг и фильтрация ридов
- Картирование на референсный геном
- Вызов вариантов (SNP, InDel) с учетом полиплоидности
- Фильтрация VCF (динамические параметры)
- Расчет статистик картирования
- Функциональная аннотация вариантов
2. Импутация генотипов
- Импутация с использованием:
- публичных референсных панелей (при наличии)
- или внутри выборки
3. Популяционная генетика
- Расчет наблюдаемой гетерозиготности
- PCA (PC1–PC10)
- Матрицы генетических дистанций и родства
- Admixture-анализ
- Филогенетическое дерево (bootstrap ≥ 1000)
- Комплексная интерпретация структуры популяции
4. GWAS-анализ
- Проведение GWAS с использованием ≥10 моделей
- линейные
- смешанные
- мультилокусные
- Учет популяционной структуры (PC 2–20)
- Подбор метода коррекции множественного тестирования
- LD-анализ (параметры подбираются индивидуально)
- Формирование списка значимых ассоциаций
- Работа с признаками без значимых ассоциаций (top SNP / корректировка порога)
5. Селекционная аналитика
- Формирование панели ДНК-маркеров
- Валидация панели:
- кросс-валидация
- независимая выборка (при наличии)
- сопоставление с QTL
- Ранжирование образцов:
- по отдельным признакам
- по комплексному индексу
- Моделирование скрещиваний:
- все комбинации (♀ × ♂)
- прогноз потомства (genomic prediction + сегрегация маркеров)
- Разработка селекционных схем:
- возвратные
- трехлинейные и др.
🌱 Объекты анализа
- Пшеница мягкая (гексаплоид, ~16 Gb, 350–400 образцов)
- Рапс (яровой и озимый, ~1.13 Gb, 100–150 образцов)
- Подсолнечник (~3.6 Gb, 100–150 образцов)
📥 Входные данные
- WGS (PE150, ≥20×), FASTQ
- Фенотипы (≥2 признаков, ≥2 локаций, мультигодовые данные)
📊 Ожидаемые результаты
- VCF (до/после фильтрации, с импутацией)
- QC-отчеты
- PCA-графики, Manhattan и QQ plots
- Матрицы дистанций и родства
- Филогенетические деревья
- Таблицы ассоциаций
- Панели ДНК-маркеров
- Ранжирование образцов
- Матрицы скрещиваний
- Рекомендации по селекционным стратегиям
🧠 Требования
- Опыт работы с NGS/WGS данными
- Уверенное владение инструментами:
- BWA / Bowtie2
- GATK / FreeBayes / bcftools
- PLINK / ADMIXTURE / EIGENSOFT
- GWAS-пакеты (GEMMA, GAPIT, Tassel и др.)
- Опыт работы с полиплоидными геномами (обязательно)
- Знание популяционной генетики и GWAS
- Опыт genomic prediction (желательно)
- Навыки работы с большими данными (HPC)
➕ Будет плюсом
- Опыт в агрогеномике / селекции растений
- Знание QTL-анализа
Адрес: Россия, Москва
Опубликована день назад