Читать «Журнал «Компьютерра» № 43 от 21 ноября 2006 года» онлайн - страница 53

Компьютерра

Как считает Джордж Черч (George Church), стотысячный рубеж будет пройден не позже 2009 года, а очень вероятно, что и раньше. Тысячный рубеж, по планам NHGRI, намечен ориентировочно на 2014 год, но по мнению Черча, в этом вопросе ясности гораздо меньше. Неясно даже, нужно ли доводить стоимость именно до тысячи долларов, а главное — нужно ли определять последовательность нуклеотидов полностью, ведь интересен лишь один процент из них. Выяснить, какие именно участки генома составляют этот процент — вполне реалистичная задача с точки зрения Черча, и если сконцентрироваться на ней, можно достичь желаемого результата (массового секвенирования) раньше.

Это только начало

Задача получить за 1000 долларов полную информацию о последовательности нуклеотидов в человеческом геноме выглядит вполне реальной. Немного смущает срок в 5-10 лет (X Prize взяла его не с потолка, а со слов самых авторитетных разработчиков быстрых методов секвенирования, но их оптимизм может оказаться немного преувеличенным). Однако рубеж в тысячу у. е. — это только промежуточный финиш. Самое интересное начнется после: полученную информацию надо будет интерпретировать.

Для начала текст можно сразу сократить на порядок, вычеркнув накопившуюся за миллиарды лет явно бессмысленную информацию. Внутри генов можно исключить из рассмотрения интроны — участки, которые вырезаются после синтеза матричной РНК. Зато придется учесть, что некоторые гены разбросаны по хромосомам, другие кодируют сразу несколько белков и т. д. — в общем, до начала анализа надо будет свести объем информации к осмысленным «словам». Большинство из этих примерно 30000 генов (вернее, пар генов) придется исключить из рассмотрения: идентифицировать функции каждого из закодированных в генах белков — задача куда более сложная, чем разработать метод дешевого секвенирования генома, а протеомика — очень молодая наука.

Выявление фенотипических проявлений генного полиморфизма (вариантов структуры генов, существенных для функций их белков) — следующий этап на пути к практическому применению информации об индивидуальном геноме. Обратите внимание: для анализа персонального генома надо исследовать не одну, а обе хромосомы в каждой из 23 пар — поэтому в условиях конкурса и указаны не три, а шесть миллиардов пар нуклеотидов. Даже такие простые признаки, как цвет кожи или глаз, определяются несколькими парами генов.

Организм состоит из сотен типов клеток, и в каждом из них активна только часть генов — и активна по-разному, в зависимости от множества внешних и внутренних факторов. Вспомните школьный учебник биологии с рисунками двух овечек одной породы (у той, которая выросла в холодном климате, шерсть заметно гуще и длиннее) и представьте, сколько сотен разных белков у них функционируют по-разному.