Protocols / Parallel Sequencing of the Transcriptome

Массовое параллельное секвенирование транскриптома с помощью технологий секвенирования следующего поколения


Технология секвенирования первого поколения (Метод Сэнджера) позволяла идентифицировать линейную последовательность нуклеотидов путем электрофоретического разделения случайно терминированных продуктов удлинения. Автоматические методы используют флуоресцентно меченые терминаторы, разделение капиллярным электрофорезом и автоматическую лазерную детекцию сигнала. Секвенрование по методу Сэнждера позволяет прочесть фрагменты ДНК длинной от 500 до 1000 п.н. Однако этот метод имеет ряд технических ограничений, главное из которых касается производительности метода, то есть количества ДНК, которая может быть расшифрована в одной реакции. Производительность в данном случае – это функция времени реакции секвенирования, числа реакций секвенирования, которые могут проходить параллельно, и длины прочтенных последовательностей (англ. – reads) в каждой реакции (Rizzo and Buck, 2012). Требования к разделению фрагментов ДНК с помощью капиллярного электрофореза для прочтения последовательности ДНК представляет первичное бутылочное горлышко для производительности этого метода, увеличивая время расшифровки первичной последовательности НК и ограничивая число реакций, которые могут идти параллельно. Несмотря на эффективность автоматизации, метод Сэнджера может прочитать только 96 реакций параллельно, и это ограничивает производительность технологии примерно до 115 тыс.п.н./день (Mardis, 2011).
В настоящее время исследователи переходят к использованию прямых технологий высокопроизводительного анализа транскриптома – так называемого РНК-секвенирования (англ. – RNAseq), – которые имеют значительные преимущества для изучения тонкой структуры транскриптома. Это метод массового параллельного секвенирования, который характеризуется беспрецедентной скоростью получения первичных последовательностей кДНК и высокой производительностью (Mortazavi et al., 2008). Методы секвенирования следующего поколения – термин, относящийся ко всем высокопроизводительным технологиям секвенирования ДНК, которые способны расшифровать большое число различных последовательностей ДНК в одной реакции (то есть параллельно). Технологии секвенирования нового поколения, в отличие от капиллярного секвенирования, основаны на параллельном выявлении присоединяемых нуклеотидов при синтезе клона ДНК в каждой из миллионов микроскопических ячеек/участках матрицы. Каждая из наиболее распространенных платформ секвенирования нового поколения  (Roche/454, Illumina, Applied Biosystems SOLiD, Ion Torrent (Life Technologies) и др.) использует собственную стратегию для реализации этого принципа. Это, в первую очередь, подходы, основанные на пиросеквенировании, обратимой флуоресценции и выявлении изменений в уровне pH среды.
Все технологии секвенирования следующего поколения (ССП) отслеживают последовательное добавление нуклеотидов к иммобилизованной и пространственно распределенной матрице ДНК при её амплификации. Различия состоят в том, каким образом генерируются эти матрицы и каким образом расшифровывается их последовательность. Эксперименты ССП можно сгруппировать на две крупных категории: сборка de novo и пересеквенирование. В случае сборки denovo собранные геномы и транскриптомы строят с нуля без использования существующих образцов (референтных геномов), тогда как в экспериментах по пересеквенированию выравнивают последовательности прочтенных фрагментов относительно референтного генома. В настоящее время проекты по сборке расшифрованных последовательностей геномов человека и ряда основных модельных организмов завершены. В связи с этим все эксперименты по расшифровке транскриптома или генома образцов, взятых у модельных организмов и человека с использованием технологий ССП представляют собой пересеквенирование (Mardis, 2011).
Большинство платформ используют клональную амплификацию фрагментов ДНК для того, чтобы продуцировать сигнал, достаточный для детекции добавленного нуклеотида. Стратегии амплификации ДНК варьируют между платформами и, в общем, включают эммульсионную ПЦР или стратегию амплификации мостиков. Важно, что все шаги амплификации могут привести к ошибкам секвенирования в экспериментах, так как используемые на этом этапе ферменты (ДНК-полимеразы) не точны на 100% и могут вводить мутации в клонально амплифицированные популяции матриц, которые последовательно маскируются как варианты последовательности в последующем анализе (Mardis, 2011).
В целом, можно заключить, что секвенирование РНК с помощью технологий ССП (RNAseq) имеет ряд преимуществ перед экспрессионными микрочипами, в том числе:
1) RNAseq не зависит от предварительных знаний о целевой последовательности;
2) Этот подход имеет большой динамический диапазон и высокую чувствительность благодаря своей цифровой природе, что особенно важно для очень обильных и скудных транскриптов;
3) анализ транскриптома является более точным, так как количественный подсчет каждого транскрипта непосредственно основан на цифровом подсчете транскриптов (Malone, Oliver, 2011).
Тем не менее, стоимость RNAseq в расчете на один образец по-прежнему является ограничивающим фактором, препятствующим расшифровке множества биологических реплик в группе, что в свою очередь необходимо для статистически значимого анализа. Кроме того, важным фактором является глубина секвенирования образца РНК, которая не всегда позволяет детектировать транскрипты, экспрессируемые на низком уровне в небольшом числе специализированных клеток. Глубина секвенирования – это среднее число прочтений, представляющих один нуклеотид в реконструируемой последовательности. 10× глубина секвенирования означает, что каждый нуклеотид в транскрипте был секвенирован, в среднем, десять раз. Важно также отметить, что из-за большого размера генерируемых по результатам ССП файлов, для проведения экспериментов с этими файлами необходимо использование командной строки Python, Perl или Unix, что не всегда удобно для биологов (Martin, Wang, 2011).

Список использованной литературы:

  1. Malone JH, Oliver B. Microarrays, deep sequencing and the true measure of the transcriptome // BMC Biol. – 2011, 9:34.
  2. Martin J. A., Wang Z. Next-generation transcriptome assembly // Nature reviews. Genetics. – 2011, 12:671-682.
  3. Mortazavi A., Kenneth McCue B.A.W., Schaeffer L., Wold B. Mapping and quantifying mammalian transcriptomes by RNA-Seq // Nature Methods – 2008, 6(7): 621-628.
  4. Mardis ER. A decade's perspective on DNA sequencing technology. // Nature. 2011 10;470(7333):198-203.
  5. Rizzo JM, Buck MJ. Key principles and clinical applications of "next-generation" DNA sequencing. // Cancer Prev Res (Phila). 2012 5(7):887-900.

 

Обзор составлен Т.В. Куликовой и А.В. Красиковой