Введение в статистическую геномику

Куратор курса: д.б.н. Аульченко Юрий Сергеевич

I. Организационно-методический раздел.
     1.1. Цели и задачи курса.
     1.2. Требования к уровню освоения содержания курса (дисциплины).
     1.3. Формы контроля
II. Содержание дисциплины.
     2.1 Новизна курса.
     2.2. Тематический план курса.
     2.3. Содержание отдельных разделов и тем.
     2.4. Перечень примерных контрольных вопросов.
III. Учебно-методическое обеспечение дисциплины.
     3.1 Образцы вопросов для экзамена.
     3.2 Список основной и дополнительной литературы.
Лекции

I. Организационно-методический раздел.


1.1. Цели и задачи курса:

Дисциплина «Введение в статистическую геномику» предназначена для студентов-биологов 4-го курса, специализирующихся на кафедре генетики и информационной биологии. Курс включает лекции и практические занятия в компьютерном классе.

Основной целью освоения дисциплины является ознакомление студентов с современными компьютерными и теоретическими методами статистической геномики и генетического картирования сложных признаков в аутбредных популяциях. Для достижения поставленной цели выделяются задачи курса:

  • определить специфику генетического анализа в аутбредных популяциях;
  • дать обзор современных методов генетического картирования, обратив особое внимание на их ограничения и особенности интерпретации результатов;
  • охарактеризовать основные направления исследований в области статистической геномики;
  • проиллюстрировать различные методические подходы на примере анализа моделированых и реальных данных.

[Назад]

1.2. Требования к уровню освоения содержания курса (дисциплины)

По окончании изучения указанной дисциплины студент должен:

  • иметь представление о современных методах генетического картирования в аутбредных популяциях;
  • знать основные принципы анализа и теоретические основы базовых методов статистической геномики,
  • проводить анализ ассоциации данных SNP-генотипирования с помощью бесплатных программных ресурсов.

[Назад]


1.3. Формы контроля

Итоговый контроль – экзамен.
Текущий контроль – упражнения и вопросы.

[Назад]

II. Содержание дисциплины.


2.1. Новизна курса.

Данный курс направлен на ознакомление студентов с современным состоянием проблем статистической геномики, а также с методами анализа, доступными через бесплатные программные ресурсы. В курсе представлены новейшие методы теоретического и компьютерного анализа генетических ассоциаций. В ходе обучения студенты получают навык практической работы с полногеномными данными по SNP-генотипированию, осваивают работу с различными пакетами программ. В результате лекционных занятий и практической работы в компьютерных классах студенты получают представление о предмете статистической геномики, что является важным для более глубокого понимания методов изучения живых систем. Актуальность этого курса определяется тем, что на современном этапе невозможно получить полное понимание принципов функционирования организма, не имея информации о генетической детерминированности различных признаков. В ответ на современные требования биологии возникла новая область знания – статистическая геномика. Поэтому подготовка высококвалифицированного специалиста-биолога требует изучения методов и принципов современного генетического анализа. Актуальность преподавания такой дисциплины признана в передовых зарубежных вузах. В России такой курс, насколько нам известно, представлен впервые. Преподавание курса статистической геномики на кафедрах генетики и информационной биологии ФЕН НГУ позволит готовить высококлассных специалистов мирового уровня.

[Назад]


2.2. Тематический план курса.

Наименование разделов и тем

Количество часов

Лекции Семинары Лабораторные работы Самостоятельная работа Всего часов
Анализ ассоциаций количественных признаков. Регрессия, корреляция, значимость. Основные дизайны генетико-эпидемических исследований. Анализ ассоциации бинарных признаков. Относительный риск, отношение шансов, тестирование. 2 2 4
Логистическая регрессия. Закон Харди-Вайнберга. Неравновесие по сцеплению. Введение в R и анализ генетических ассоциаций. 2 2 4
Множественное тестирование и ошибка первого рода. Метод полногеномного анализа ассоциаций. Знакомство с пакетом GenABEL, контроль качества, полногеномный анализ ассоциаций. 2 2 4
Мощность. Геномное покрытие. Популяционная стратификация. Полногеномный анализ ассоциаций при сложной популяционной структуре. 2 2 4
Мета-анализ. Анализ сцепления. Обзор доступных баз данных (Hapmap, 1000g, dbGAP). 2 2 4
Итого по курсу 10 10 20

[Назад]


2.3. Содержание отдельных разделов и тем.

Лекция 1. Анализ ассоциаций количественных признаков. Регрессия, корреляция, значимость.
Лекция 2. Основные дизайны генетико-эпидемических исследований.
Лекция 3. Анализ ассоциации бинарных признаков. Относительный риск, отношение шансов, тестирование.
Лекция 4. Логистическая регрессия. Закон Харди-Вайнберга.
Лекция 5. Неравновесие по сцеплению. Введение в R и анализ генетических ассоциаций
Лекция 6. Множественное тестирование и ошибка первого рода.
Лекция 7. Метод полногеномного анализа ассоциаций. Знакомство с пакетом GenABEL, контроль качества, полногеномный анализ ассоциаций
Лекция 8. Мощность. Геномное покрытие. Популяционная стратификация.
Лекция 9. Полногеномный анализ ассоциаций при сложной популяционной структуре. Мета-анализ.
Лекция 10. Анализ сцепления. Обзор доступных баз данных (Hapmap, 1000g, dbGAP). Мета-анализ

Программа практических занятий «Введение в статистическую геномику»

  • Методы статического анализа ассоциаций. Пакет программ R
  • Методы контроля качества генетических данных. Пакет программ GenABEL.
  • Методы полногеномного анализа. Пакеты программ GenABEL, ProbABEL, MixABEL.
  • Методы полногеномного мета-анализа. Пакеты программ MetABEL.
  • Базы и банки данных Hapmap, 1000g, dbGAP и системы доступа к ним.

[Назад]


2.4. Перечень примерных контрольных вопросов.

  1. Как проводится анализ ассоциаций количественных признаков
  2. Что такое регрессия
  3. Что такое корреляция
  4. Какие существуют основные дизайны генетико-эпидемических исследований
  5. Как проводится анализ ассоциации бинарных признаков
  6. Что такое относительный риск
  7. Что такое отношение шансов
  8. Что такое и как проводится логистическая регрессия
  9. Определение закона Харди-Вайнберга
  10. Рассказать про неравновесие по сцеплению
  11. Множественное тестирование и ошибка первого рода
  12. Метод полногеномного анализа ассоциаций (ПГАА)
  13. Мощность ПГАА
  14. Геномное покрытие
  15. Роль популяционной стратификации в ПГАА
  16. Рассказать про мета-анализ

[Назад]

III. Учебно-методическое обеспечение дисциплины.


3.1 Образцы вопросов для экзамена.

Автоматически (с использованием метода Монте-Карло) сгенерированные билеты по приблизительному шаблону

***** Problem 1 *****

In a sample, the following distribution of genotypes was obtained:
AA AB BB
gt 241 137 22

Questions:
* What is the frequency of 'B' allele?
* What is the distribution expected under HWE?
* Compute the chi-square test for HWE
* Is deviation from HWE significant?

***** Problem 2 *****

Design: random sample from population
Data:

Factor Absent Factor Present
Control 242 57
Case 68 33

Questions:
* Characterize the strength of association between the disease and the risk factor
* Compute the value of score test for association in this data
* Is association significant? (use p-value < 0.05 as significance threshold)

***** Problem 3 *****

Data:
Trait Genotype
1 5.8 0
2 4.8 0
3 4.7 1
4 5.4 0
5 5.2 1
6 5.1 1
7 5.3 0
8 5.0 0
9 5.9 0
10 4.8 0
11 5.6 1

Questions:
* What is the variance of the trait?
* What is the variance of the genotype?
* What is covariance between the trait and the genotype?
* What is the coefficient of regression of the trait onto genotype?
* What is correlation between the trait and the genotype?
* Compute the score test for association between the trait and the genotype
* Is association siginificant (use p-value < 0.05 to claim significance)?

***** Problem 4 *****

Data:
beta se
Study 1 0.31 0.42
Study 2 -0.24 0.36
Study 3 0.28 0.27

Questions:
* Is association significant in any individual study? Which ones?
* Perform meta-analysis. What is the value of meta-analysis beta?
* What is the value of meta-analysis se?
* What is the value of meta-analysis test statistic?
* Is association significant in meta-analysis (p<0.05)?

Ответа на письменную часть достаточно для получения удовлетворительной оценки. Чтобы больше –дополнительные вопросы.

[Назад]


3.2. Список основной и дополнительной литературы

  1. Бородин, П.М. (2011) Кошки и гены.
  2. Лакин, Г.Ф. (1990) Биометрия
  3. Aulchenko, Y & GenABEL project, The. (2013) The GenABEL tutorial.
  4. The GenABEL project video tutorials @ http://www.genabel.org/tutorials/video

[Назад]

Видео лекции

Просмотреть видео лекции можно тут