Организация и функционирование молекулярно-генетических систем III: методы анализа генетических текстов



Куратор курса:к.б.н. Левицкий Виктор Георгиевич

I. Организационно-методический раздел.
    1.1. Цели и задачи курса.
    1.2. Требования к уровню освоения содержания курса (дисциплины).
    1.3. Формы контроля
II. Содержание дисциплины.
     2.1 Содержание отдельных разделов и тем.
     2.2 Ресурсы.
     2.3 Примерные контрольные вопросы и задания для самостоятельной работы.
     2.4 Образцы вопросов для подготовки к экзамену.
III. Учебно-методическое обеспечение дисциплины.
     Список основной и дополнительной литературы
     Лекции (2011-2012)
     Лекции (2007-2008)
     Лекции (2006-2007)
     Лекции (2005-2006)
     Лекции (2003-2004)
    Задания для практических занятий (2003 – 2004)

I. Организационно-методический раздел.


1.1. Цели и задачи курса:

Дисциплина  предназначена для ознакомления студентов с современными представлениями об основных методах представления и анализа данных в информационной биологии.

Целью курса является подготовка молодых специалистов для работы в научно-исследовательских организациях, занимающихся решением фундаментальных биологических проблем, экологии, медицины, охраны окружающей среды и т.д. а также проблем, решаемых на стыках биологии и таких наук как математика, информатика, физика, химия. Конкретной важной задачей является освоение студентами методов анализа генетических текстов, включая прикладные программы и интернет-ресурсы и базы данных.

[Назад]

1.2. Требования к уровню освоения содержания курса (дисциплины)

По окончании изучения указанной дисциплины студент должен

  • иметь представление о методах анализа текстовых последовательностей, типах функциональных кодов геномной ДНК, методах предсказания структуры генов эукариот;
  • знать способы представления информации в геномных базах данных, современные метода выявления и анализа функциональных кодов геномной ДНК достоинства и недостатки;
  • уметь самостоятельно делать запросы в геномные базы данных и извлекать их результаты, рассчитывать статистические характеристики, используемые для сравнения точности разных методов распознавания.

[Назад]

1.3. Формы контроля

Итоговый контроль. Для контроля усвоения дисциплины ученым планом предусмотрен экзамен.
Текущий контроль. В течение семестра выполняются задания, проводится тестирование в ходе занятий в комьютерных классах. Выполнение указанных видов работ является обязательным для всех студентов, а результаты текущего контроля служат основанием для выставления оценок в ведомость контрольной недели на факультете.

[Назад]


II. Содержание дисциплины.

За короткий срок (1980-2000 гг.) в молекулярной генетике и информатике произошли революционные изменения, повлиявшие на весь «ландшафт» современной биологии. Началась эпоха массовой расшифровки геномов, в связи с этим появились совершенно новые направления наук на стыке биологии, математики, информатики, физики и химии. Данный не имеет аналогов в России, подобные курсы только начинают свое развитие в Москве (МГУ). В настоящее время поисковые системы сети Интернет по русскоязычным запросам, соответствующим ключевым словам курса не находят других источников, кроме методических материалов, разработанных создателями курса.

2.1 Содержание отдельных разделов и тем.

Лекции

  1. Обзор задач биоинформатики, связанных с анализом и обработкой текстовых последовательностей. Операции с последовательностями, доступ к базам и форматы данных.
  2. Обзор задач биинформатики как задач компьютерного анализа генетических текстов.
  3. Базы данных последовательностей ДНК.
  4. Определение генетического текста.
  5. Программы анализа последовательностей ДНК, РНК и белков.
  6. Сравнение последовательностей. Дот-матрица для сравнения последовательностей.
  7. Выравнивание последовательностей с помощью динамического программирования.
  8. Поиск локального выравнивания последовательностей.
  9. Множественное выравнивание последовательностей.
  10. Предсказание вторичной структуры РНК.
  11. Установление эволюционных взаимосвязей по последовательностям.
  12. Поиск гомологии в базах данных.
  13. Методы FASTA и BLAST для поиска в базах данных.

Семинары

Использование баз данных в сети Интернет. Использование систем ENTREZ NCBI и EMBLдля поиска литературы и поиска последовательностей из банков данных.

[Назад]


2.2 Ресурсы:

  1. NCBI (Natl Center Biotech Information) — GenBank: http://www.ncbi.nlm.nih.gov/
  2. EBI (European Bioinformatics Institute) — EMBL: http://www.ebi.ac.uk/
  3. ENTREZ: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi
  4. PUBMED: http://www.ncbi.nlm.nih.gov/pubmed

[Назад]


2.3 Примерные контрольные вопросы и задания для самостоятельной работы.

  1. EMBL – формы логических запросов, форматы представления последовательностей, описания полей базы.
  2. Способы и методика работы с программами выравнивания BLAST, BLAST2. работа с конкретной парой примеров.

[Назад]


2.4 Образцы вопросов для подготовки к экзамену.

  1. Обзор задач биоинформатики, связанных с анализом и обработкой текстовых последовательностей. Операции с последовательностями, доступ к базам и форматы данных
  2. Перечислить основные задачи компьютерного анализа генетических текстов.
  3. Рассказать о методе сравнения последовательностей с помощью матрицы точечной гомологии (Дот-матрица или метод диаграмм).
  4. Понятие выравнивания последовательностей. Глобальное и локальное выравнивания, (указать отличия). Перечислить основные алгоритмы.
  5. Классификация повторов в генетических текстах по направлению, механизмам происхождения, расположению в геноме.

[Назад]

III. Учебно-методическое обеспечение дисциплины.


Список основной и дополнительной литературы

  1. Mount D.W. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor Laboratory Press 2001.
  2. Bioinformatics of genome regulation and structure. Ed. by N.Kolchanov and R. Hofestaedt, Kluwer Academic Publishers, Boston/Dordrecht/London, 2004.
  3. Сингер М., Берг П. Гены и геномы. Москва, “Мир”, 1998.
  4. Гены; Льюин Б.: Пер. с англ. Москва, “Мир”, 1987.

Лекции (2011-12)

Лекция №1 ChIP-seq: секвенирование, технологии и задачи биоинформатики (лектор Орлов Ю.Л.) (скачать)

Лекции (2007-08)

Лекция №1. Machine Learning (скачать)
Комментарии к лекции 1 (скачать)

Лекция №2. Исследование повторов в текстах. Формальные языковые системы и алгоритмы (скачать)
Комментарии к лекции 2(скачать)

Лекция №3. Нейронные сети. Байесовские статистики (скачать)

[Назад]

Лекции (2006 — 2007)

Лекция №1.Статистический анализ микрочиповых данных (скачать)
Комментарии к лекции 1 (скачать)

Лекция №2. Исследование функциональных характеристик генома (скачать)
Комментарии к лекции (скачать)

Лекция №3. Исследование функциональных характеристик генома (скачать)
Комментарии к лекции 3 (скачать)

Лекция №4. Исследование функциональных характеристик генома (скачать)

Лекция №5.Нейронные сети (скачать)
Комментарии к лекции 5 (скачать)

Лекция №6. Machine Learning (скачать)
Комментарии к лекции 6 (скачать)

[Назад]

Лекции (2005 — 2006)

Лекция №1.Исследование качественных и количественных характеристик транскриптома (скачать)
Комментарии к лекции 1(скачать)

Лекция №2. Исследование качественных и количественных характеристик транскриптома (скачать)
Комментарии к лекции 2(скачать)

Лекция №3. Исследование качественных и количественных характеристик транскриптома (скачать)
Комментарии к лекции 3(скачать)

[Назад]

Лекции (2003 — 2004)

Лекция №1. Операции с последовательностями, доступ к данным и форматы данных. Базы данных последовательностей ДНК EMBL и GenBank (скачать)
Комментарии к лекции 1 (скачать)

Лекция №2. Обзор задач биоинформатики, связанных с анализом и обработкой текстовых последовательностей (скачать)
Комментарии к лекции 2 (скачать)

Лекция №3. Исследование повторов в текстах. Формальные языковые системы (скачать)
Комментарии к лекции 3(скачать)

Лекция №4. Исследование повторов в текстах. Алгоритмы (скачать)
Комментарии к лекции 4 (скачать)

Лекция №5. Типы функциональных кодов геномной ДНК (скачать)
Комментарии к лекции 5 (скачать)

Лекция №6. Геномные базы данных (скачать)
Комментарии к лекции 6 (скачать)

Лекция №7. Геномные базы данных (скачать)
Комментарии к лекции 7 (скачать)

Лекция №8. Методы предсказания структуры генов эукариот (скачать)
Комментарии к лекции 8 (скачать)

Лекция №9. Парное выравнивание и сравнение последовательностей. Множественное выравнивание (скачать)

Лекция №10.Анализ и распознавание регуляторных элементов геномов эукариот (скачать)

Лекция №11. Исследование качественных и количественных характеристик транскриптома (скачать)
Комментарии к лекции 11(скачать)

Лекция №12. Исследование качественных и количественных характеристик транскриптома (скачать)
Комментарии к лекции 12 (скачать)

Лекция №13. Статистические характеристики, используемые для сравнения точности разных методов распознавания (скачать)

[Назад]

Задания для практических занятий (2003 — 2004)

Задание №1. Интернет-ссылки (скачать)

Задание №2. Работа с геномными карточками (скачать)

Задание №3.Анализ структуры гена эукариот. Предсказание структуры гена (скачать)

Задание №4. (a) Запросы в PubMed, GenBank, SRS (EMBL); (b) Использование программ распознавания промоторов; (c) Геномные базы данных, карты хромосом эукариот (скачать)

Задание №5. (a) Запросы SRS (EMBL); (b) Геномные базы данных LocusLink; (c) Составление карты сайтов рестрикции WebCutter (скачать)

[Назад]