Математические модели в естественнонаучном образовании. Том II. Денис Владимирович Соломатин
Чтение книги онлайн.

Читать онлайн книгу Математические модели в естественнонаучном образовании. Том II - Денис Владимирович Соломатин страница 17

СКАЧАТЬ 5.23.  Деревья для задачи 5.4.5.

      5.4.6. Если приведены последовательности для 3 терминальных таксонов, то информативных сайтов быть не может. Объясните, почему это так, и почему это не имеет значения.

      5.4.7. Основания на определенном участке в выровненных последовательностях из разных таксонов образуют закономерность. Например, при сравнении

 последовательностей на участке шаблонная запись (ATTGA) означает, что A появляется на этом участке в последовательности первого таксона, T во второй, T в третьей, G в четвертой и A в пятой.

      а. Объясните, почему при сравнении последовательностей для

 таксонов может появиться
 возможных шаблона.

      б. Некоторые шаблоны неинформативны. Простыми примерами являются четыре паттерна, показывающие одно и то же основание во всех последовательностях. Объясните, почему существуют

 неинформативных паттернов, все последовательности которых совпадают, кроме одной.

      в. Сколько всего существует неинформативных шаблонов, в которых 2 основания появляются один раз, а все остальные совпадают?

      г. Сколько существует неинформативных шаблонов, в которых 3 основания появляется один раз, а все остальные согласованы?

      д. Объедините свои ответы, чтобы рассчитать количество информативных шаблонов для

 таксонов.  Являются ли большинство шаблонов информативными для больших
?

      5.4.8. Компьютерная программа, вычисляющая оценки экономии, может работать следующим образом: сначала сравните последовательности и подсчитайте количество сайтов

 для каждого появляющегося информативного шаблона. Затем для данного дерева вычислите оценки экономии
 и
.

      5.4.9. Показатели экономичности можно рассчитать еще эффективнее, используя тот факт, что несколько разных шаблонов всегда дают одинаковую оценку. Например, при сопоставлении 4 таксонов шаблоны (ATTA) и (CAAC) будут иметь одинаковую оценку.

      а. Используя это наблюдение для 4 таксонов определите, сколько различных информативных таблиц должно быть рассмотрено, чтобы получить оценку экономии для всех возможных комбинаций?

      б. Повторите часть (а) для 5 таксонов.

      5.4.10. Используйте метод максимальной экономии для построения некорневого дерева для моделируемых последовательностей a1, a2, a3 и a4 в файле данных seqdata.mat. Сначала поместите последовательности в строки массива командой a=[a1;a2;a3;a4]. Затем найдите информативные сайты самостоятельно запрограммированной функцией infosites=informative(a). Наконец, извлеките информативные сайты с помощью команды ainfo=a(:,infosites).

      а. Каков процент информативных сайтов?

      б. Сколько различных деревьев следует проанализировать, чтобы найти самое экономное, относящееся к четырем таксонам?

СКАЧАТЬ