<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0250-5460</journal-id>
<journal-title><![CDATA[Revista Boliviana de Química]]></journal-title>
<abbrev-journal-title><![CDATA[Rev. Bol. Quim]]></abbrev-journal-title>
<issn>0250-5460</issn>
<publisher>
<publisher-name><![CDATA[Universidad Mayor de San Andrés]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0250-54602017000200002</article-id>
<title-group>
<article-title xml:lang="en"><![CDATA[Bioinformatic analysis of Rna-Seq with a perspective for Bolivia]]></article-title>
<article-title xml:lang="es"><![CDATA[Análisis bioinformático de Arn-Seq con una perspectiva para Bolivia]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rollano Peñaloza]]></surname>
<given-names><![CDATA[Oscar M]]></given-names>
</name>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Mollinedo Portugal]]></surname>
<given-names><![CDATA[Patricia]]></given-names>
</name>
</contrib>
</contrib-group>
<aff id="A">
<institution><![CDATA[,  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>00</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>00</month>
<year>2017</year>
</pub-date>
<volume>34</volume>
<numero>2</numero>
<fpage>50</fpage>
<lpage>55</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_arttext&amp;pid=S0250-54602017000200002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_abstract&amp;pid=S0250-54602017000200002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_pdf&amp;pid=S0250-54602017000200002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT RNA-seq has become the tool of choice for transcriptome studies. Transcriptome provides key information about global changes of an organism under certain conditions at a determined moment. Next-Generation Sequencing technology has made transcriptomic studies available for everyone, increasing the demands of researchers within the bioinformatic field. Therefore, in the present review we are describing the bioinformatics workflow, analysis and applications of RNA-seq. At the same time, we want to present a computing cluster capable to perform bioinformatic analysis placed in Bolivia, known as CnCaBo.]]></p></abstract>
<abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN Spanish title: Análisis bioinformático de ARN-SEQ con una perspectiva para Bolivia. RNA-seq se ha convertido en la herramienta más utilizada para el estudio de transcriptomas. El transcriptoma nos provee información clave sobre los cambios globales de un organismo bajos ciertas condiciones en un determinado momento. Las nuevas tecnologías de secuenciación masiva han permitido que la investigación en el área de la transcriptómica esté al alcance de todos, incrementando la demanda de investigadores en el área de la bioinformática. Es por eso que el presente artículo de revisión pretende contribuir al conocimiento del análisis bioinformático de transcriptómica mediante RNA-seq y sus aplicaciones. Al mismo tiempo queremos dar a conocer la implementación de un clúster computacional para realizar análisis bioinformáticos localizado en Bolivia denominado CnCaBo]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[RNA-seq]]></kwd>
<kwd lng="es"><![CDATA[CnCaBo]]></kwd>
<kwd lng="es"><![CDATA[Transcriptomica]]></kwd>
<kwd lng="es"><![CDATA[Nueva generación de Secuenciación masiva]]></kwd>
<kwd lng="es"><![CDATA[Bioinformática]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right" class="MsoNormal"><font size="2"><b><font face="Verdana">ART&Iacute;CULOS DE REVISI&Oacute;N</font></b></font></p>     <p align="right" class="MsoNormal">&nbsp;</p>     <p align="center" class="MsoNormal"><font size="4" face="Verdana"><b>Bioinformatic  analysis of Rna-Seq with a perspective for Bolivia</b></font></p>     <p align="center" class="MsoNormal">&nbsp;</p>     <p align="center" class="MsoNormal"><b><font size="3" face="Verdana">An&aacute;lisis bioinform&aacute;tico de Arn-Seq con una perspectiva para Bolivia</font></b><font size="3" face="Verdana"></font></p>     <p align="center" class="MsoNormal">&nbsp;</p>     <p align="center" class="MsoNormal">&nbsp;</p>     <p align="center"><font color="#000000" size="2" face="Verdana"><b>Oscar M. Rollano Pe&ntilde;aloza*, Patricia Mollinedo Portugal**</b></font>    <br>   <font color="#000000" size="2" face="Verdana">Laboratorio de Productos Naturales, Pruebas Biol&oacute;gicas, Instituto de Investigaciones en Productos Naturales IIPN, Ciencias Qu&iacute;micas, Facultad de Ciencias Puras y Naturales FCPN, Universidad Mayor de San Andr&eacute;s UMSA, P.O. Box 303, Calle Andr&eacute;s Bello s/n, Ciudad Universitaria Cota Cota, Tel. +59122795878, La Paz, Bolivia, *<a href="mailto:omrollano@umsa.bo">omrollano@umsa.bo</a>, ** <a href="mailto:pamollinedo@umsa.bo">pamollinedo@umsa.bo</a>, <a href="mailto:pattymollinedo@gmail.com">pattymollinedo@gmail.com</a>, <a href="mailto:www.umsa.bo">www.umsa.bo    <br> </a></font><font color="#000000" size="2" face="Verdana"><b>Received</b> 06 13 2016 <b>Accepted</b> 06 27 2017 <b>Published</b>  06   30   2017</font></p>     ]]></body>
<body><![CDATA[<p align="justify">&nbsp;</p>     <p align="justify">&nbsp;</p> <hr>     <p align="justify"><font color="#000000" size="2" face="Verdana"><b>ABSTRACT</b></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">RNA-seq has become the tool of choice for transcriptome studies. Transcriptome provides key information about global changes of an organism under certain conditions at a determined moment. Next-Generation Sequencing technology has made transcriptomic studies available for everyone, increasing the demands of researchers within the bioinformatic field. Therefore, in the present review we are describing the bioinformatics workflow, analysis and applications of RNA-seq. At the same time, we want to present a computing cluster capable to perform bioinformatic analysis placed in Bolivia, known as CnCaBo.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><b>Keywords: </b><i>RNA-seq, CnCaBo, Transcriptomica, Nueva generaci&oacute;n de Secuenciaci&oacute;n masiva, Bioinform&aacute;tica</i></font></p> <hr>     <p align="justify"><font color="#000000" size="2" face="Verdana"><b>RESUMEN</b></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><b><i>Spanish title: </i></b><i>An&aacute;lisis bioinform&aacute;tico de ARN-SEQ con una perspectiva para Bolivia. </i>RNA-seq se ha convertido en la herramienta m&aacute;s utilizada para el estudio de transcriptomas. El transcriptoma nos provee informaci&oacute;n clave sobre los cambios globales de un organismo bajos ciertas condiciones en un determinado momento. Las nuevas tecnolog&iacute;as de secuenciaci&oacute;n masiva han permitido que la investigaci&oacute;n en el &aacute;rea de la transcript&oacute;mica est&eacute; al alcance de todos, incrementando la demanda de investigadores en el &aacute;rea de la bioinform&aacute;tica. Es por eso que el presente art&iacute;culo de revisi&oacute;n pretende contribuir al conocimiento del an&aacute;lisis bioinform&aacute;tico de transcript&oacute;mica mediante RNA-seq y sus aplicaciones. Al mismo tiempo queremos dar a conocer la implementaci&oacute;n de un cl&uacute;ster computacional para realizar an&aacute;lisis bioinform&aacute;ticos localizado en Bolivia denominado CnCaBo.</font></p> <hr>     <p align="justify">&nbsp;</p>     <p align="justify">&nbsp;</p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><b><font size="3">INTRODUCCI&Oacute;N</font></b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font color="#000000" size="2" face="Verdana">La informaci&oacute;n biol&oacute;gica heredable de todos los seres vivos est&aacute; codificada en secuencias de DNA segmentadas y localizadas en regiones espec&iacute;ficas del cromosoma que cumplen funciones &uacute;nicas, &eacute;stas secuencias se denominan genes. El mecanismo por el cu&aacute;l estos genes son decodificados y traducidos en unidades estructurales y funcionales se denomina expresi&oacute;n g&eacute;nica. La expresi&oacute;n g&eacute;nica consiste en la transcripci&oacute;n de dichas secuencias de DNA en mol&eacute;culas de RNA (tambi&eacute;n conocidas como transcritos), que pueden ser procesados en RNA funcional no codificante o traducidos en prote&iacute;nas. Es as&iacute; que las mol&eacute;culas de DNA, RNA y prote&iacute;nas constituyen los bloques esenciales para determinar la forma, funcionamiento y diferentes estrategias para la continuidad de la vida que definen a un organismo. La activaci&oacute;n de la expresi&oacute;n g&eacute;nica, as&iacute; como la cantidad de transcritos que se producen, es</font> <font color="#000000" size="2" face="Verdana">un proceso estrictamente regulado que depende de las se&ntilde;ales que el organismo reciba. El conjunto total de transcritos en un determinado momento bajo ciertas condiciones fisiol&oacute;gicas es conocido como transcriptoma. As&iacute;, un transcriptoma nos brinda la informaci&oacute;n completa acerca de la expresi&oacute;n g&eacute;nica de una c&eacute;lula, tejido u organismo en diferentes escenarios como ser las etapas del desarrollo, el progreso de una enfermedad y la respuesta a est&iacute;mulos bi&oacute;ticos o abi&oacute;ticos. La informaci&oacute;n proveniente de los transcriptomas nos permite identificar nuevos genes, rutas metab&oacute;licas y cascadas de se&ntilde;alizaci&oacute;n representativas de ciertos procesos biol&oacute;gicos, la ciencia encargada de este estudio es la transcript&oacute;mica. Los genes expresados de forma significativa pueden ser utilizados como marcadores moleculares para ciertos rasgos de inter&eacute;s. Estos marcadores gen&eacute;ticos pueden ser utilizados para identificar, diferenciar, seleccionar variedades de plantas y generar nuevas variedades con los rasgos deseados [1-3].</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">Tradicionalmente el m&eacute;todo elegido para el estudio de transcriptomas ha sido los chips de DNA (microarrays), que constan de fragmentos de DNA unidos a una superficie s&oacute;lida, d&oacute;nde cada fragmento representa un gen o regi&oacute;n de un genoma de referencia, que al entrar en contacto con una secuencia complementaria de DNA copia del RNA (cDNA) proveniente de la muestra se hibridizan y generan una se&ntilde;al fluorescente que es cuantificable de forma relativa mediante la intensidad de la se&ntilde;al fluorescente bajo diferentes condiciones. Los chips de DNA tienen ciertas limitaciones, como ser la baja sensibilidad para detectar genes expresados en un bajo n&uacute;mero de copias y la dependencia de un genoma de referencia anotado [4-6].</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">Éstas limitaciones desaparecieron cuando se introdujo la tecnología del RNA-seq para el estudio de transcriptomas que además generó nuevos descubrimientos como el empalme alternativo (splicing alternativo) en diferentes tejidos [7, 8]. La investigación transcriptómica con RNA-seq se ha facilitado bastante debido a que ya existen más de 50 plantas con su genoma completamente secuenciado [9] y se estima que sobrepasen los 100 genomas para el 2018. Además, este método permite la investigación de especies relativamente desconocidas, incrementando el conocimiento sobre las funciones de genes desconocidos y el descubrimiento de nuevos genes [10]. El RNA-seq es una herramienta que consta de la secuenciación masiva del RNA global de un organismo, que normalmente genera varios millones de secuencias (en inglés: reads) por muestra. El método se puede resumir como la extracción del RNA total de una muestra, la captura y purificación del RNA deseado (usualmente mRNA), la conversión a cDNA y finalmente la secuenciación masiva.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">La secuenciaci&oacute;n var&iacute;a mucho dependiendo de la tecnolog&iacute;a empleada, por lo cual existen varias investigaciones y publicaciones enfocadas en la descripci&oacute;n de la qu&iacute;mica de secuenciaci&oacute;n de las diferentes compa&ntilde;&iacute;as [11-14]. La diferencia m&aacute;s marcada entre los m&eacute;todos de secuenciaci&oacute;n masiva depende de si es para una sola mol&eacute;cula o varias mol&eacute;culas amplificadas previamente por PCR (Reacci&oacute;n en Cadena de la Polimerasa). La secuenciaci&oacute;n masiva con amplificaci&oacute;n previa es la tecnolog&iacute;a m&aacute;s utilizada, en la cual el cDNA es fragmentado, ligado a adaptadores espec&iacute;ficos y amplificado, posteriormente se procede a un armado de librer&iacute;as para su secuenciaci&oacute;n masiva. &Eacute;sta tecnolog&iacute;a es conocida como la nueva generaci&oacute;n de secuenciaci&oacute;n (NGS: Next-Generation Sequencing) que es ofrecida por compa&ntilde;&iacute;as como <u>SOLiD</u>, <u>IonTorrent</u> e <u>Illumina</u>. Illumina es la tecnolog&iacute;a m&aacute;s utilizada que pr&aacute;cticamente ha dominado el mercado [11, 14, 15]. Por otra parte, la secuenciaci&oacute;n de una sola mol&eacute;cula es conocida como la Tercera Generaci&oacute;n de Secuenciaci&oacute;n (TGS) que consta en la ligaci&oacute;n del cDNA a adaptadores, d&oacute;nde &eacute;ste puede ser o no fragmentado y se procede directamente a secuenciar [16]. Las tecnolog&iacute;as disponibles para secuenciaci&oacute;n de una sola mol&eacute;cula en el mercado son <u>Pacific Biosciences</u>, <u>Oxford Nanopore</u> y Helicos Biosciences [20] comercializada bajo la marca <u>Seqll</u>. Las ventajas de la secuenciaci&oacute;n de una sola mol&eacute;cula (TGS) comparada con la tecnolog&iacute;a NGS son la identificaci&oacute;n de transcritos pobremente amplificados por PCR, la eliminaci&oacute;n del complejo proceso de la preparaci&oacute;n de librer&iacute;as de cDNA [17] y la gran longitud de las secuencias obtenidas [18,19]. Entre las desventajas de las tecnolog&iacute;as TGS est&aacute; la alta tasa de error que se producen en los extremos de las mol&eacute;culas y el menor volumen de informaci&oacute;n (throughput) generado por cada corrida.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">Los equipos para realizar secuenciaci&oacute;n masiva todav&iacute;a tienen costos muy altos, por lo tanto, una mejor alternativa para investigaciones que cuentan con presupuestos limitados es el env&iacute;o de muestras a centros de secuenciaci&oacute;n NGS. Actualmente existen varios centros que se dedican exclusivamente a realizar secuenciaci&oacute;n NGS (ej. Sequentia Biotech-Espa&ntilde;a, IGA technology services - Italia, Beijing Genomics Institute - China, CATG -Argentina, Omega Bioservices - USA), los cu&aacute;les realizan secuenciaci&oacute;n masiva de alta calidad a partir de muestras de tejido, DNA o RNA. La informaci&oacute;n gen&oacute;mica generada por estos centros puede ser descargada desde cualquier parte del mundo para proceder a su an&aacute;lisis bioinform&aacute;tico. Todo el software necesario es de distribuci&oacute;n libre y est&aacute; en desarrollo permanente, adem&aacute;s existe una gran comunidad bioinform&aacute;tica constantemente activa que aporta al aprendizaje y a la resoluci&oacute;n de problemas.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">Sin embargo, la informaci&oacute;n bioinform&aacute;tica en bases de datos para los pa&iacute;ses hispanos y en idioma espa&ntilde;ol es escasa, por lo cual en el siguiente art&iacute;culo describimos el procedimiento y an&aacute;lisis bioinform&aacute;tico para la investigaci&oacute;n transcript&oacute;mica mediante RNA-seq.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font color="#000000" size="3" face="Verdana"><b>AN&Aacute;LISIS BIOINFORM&Aacute;TICO PARA RNA-SEQ</b></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">El an&aacute;lisis bioinform&aacute;tico para RNA-seq, empieza con la filtraci&oacute;n de secuencias con calidad aceptable para alinear fidedignamente al genoma o transcriptoma de referencia. Las secuencias alineadas deben ser cuantificadas, normalizadas y sometidas a un an&aacute;lisis estad&iacute;stico para conocer los genes que han sido expresados significativamente. Finalmente, se identifican los roles y funciones de los genes expresados.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Control de calidad</b></i></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font color="#000000" size="2" face="Verdana">Las secuencias obtenidas (reads) pueden tener errores de tipo instrumental o fallas t&eacute;cnicas, por lo cual es necesario evaluar la calidad de las mismas. El software m&aacute;s utilizado para estas tareas es <u>FastQC</u> que permite obtener par&aacute;metros de calidad por nucle&oacute;tido secuenciado. En caso de que la calidad de las secuencias fuera muy baja, existen diversas herramientas que ayudan a eliminar ciertas secuencias o a recortar el extremo de las secuencias que tiene una baja calidad con software como <u>Prinseq</u> ó <u>Trimmomatic</u>.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Mapeo y visualizaci&oacute;n</b></i></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">El mapeo gen&oacute;mico consiste en alinear las secuencias (reads) obtenidas mediante NGS con el genoma (o transcriptoma) de referencia. Mapeando las secuencias obtenemos informaci&oacute;n de su localizaci&oacute;n en el genoma, la cual puede ser utilizada para identificar y cuantificar los genes expresados, conocer las variantes al&eacute;licas y adem&aacute;s descubrir nuevos genes. En especies poco estudiadas puede ser que el genoma de referencia a&uacute;n no est&eacute; disponible, en estos casos es posible alinear a un transcriptoma ensamblado <i>de novo </i>[21]. La primera consideraci&oacute;n para elegir un software de alineamiento es el splicing alternativo. En organismos que no tienen intrones es mejor utilizar alineadores contiguos como <u>Bowtie2</u> [22] &oacute; <u>BWA</u> [23] que fueron dise&ntilde;ados para alinear DNA. Sin embargo, cuando se tienen genomas que poseen intrones es mejor utilizar alineadores como <u>Tophat2</u> [24], Hisat2 [25], STAR [26], GSNAP [27], SOAP2 [28] o Kallisto [29].</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Manipulaci&oacute;n de secuencias alineadas y detecci&oacute;n de polimorfismos de un solo nucle&oacute;tido (SNPs)</b></i></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">La alineaci&oacute;n provee grandes cantidades de informaci&oacute;n que requieren ser procesadas de distintas maneras para su an&aacute;lisis posterior. Los millones de secuencias alineadas pueden ser ordenadas de varias maneras y pueden proveernos valiosa informaci&oacute;n como inserciones y deleciones, las herramientas m&aacute;s utilizadas son <u>Samtools</u> [30] y <u>Picard</u>. Esta informaci&oacute;n puede ser utilizada por programas como <u>Bedtools</u> para detectar SNPs, que a su vez se pueden utilizar para detectar todo tipo de mutaciones y variantes en el genoma analizado autom&aacute;ticamente.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Visualizaci&oacute;n del alineamiento</b></i></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">La visualizaci&oacute;n de un genoma alineado es altamente recomendado porque nos permite comprobar los datos provenientes del an&aacute;lisis autom&aacute;tico. Adem&aacute;s de identificar inserciones y deleciones, SNPs, nuevas variantes de splicing alternativo y otras diferencias con el genoma de referencia de forma manual. Existen diferentes tipos de software con diferentes ventajas pero uno de los m&aacute;s recomendados es el <u>IGV (Integrative Genomics Viewer)</u> [31].</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Conteo de secuencias y normalizaci&oacute;n</b></i></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">Este conteo nos permite identificar cu&aacute;ntas secuencias han sido alineadas a una parte o al genoma completo. La cantidad de secuencias (RNA-seq) alineadas a un gen especifico nos determinar&aacute; su nivel de expresi&oacute;n g&eacute;nica. Uno de los programas m&aacute;s utilizados es el <u>Htseq</u> [32]. Para realizar un an&aacute;lisis apropiado de expresi&oacute;n g&eacute;nica mediante RNA-seq, lo usual es una normalizaci&oacute;n debido a los diversos tama&ntilde;os de los genes y a la variaci&oacute;n de la profundidad (depth) en la secuenciaci&oacute;n de cada muestra. Diferentes unidades se han propuesto como RPKM (Secuencias (reads) por Kilobase de transcrito por Mill&oacute;n de secuencias mapeadas) y FPKM (Fragmentos de transcrito por Mill&oacute;n de secuencias mapeadas), sin embargo dos unidades son las m&aacute;s utilizadas: Transcritos por Mill&oacute;n (TPM) y Medias de los valores Majustados (TMM) debido a la menor variaci&oacute;n obtenida en la normalizaci&oacute;n de los genes de referencia. Si se utiliza un transcriptoma <i>de novo </i>para el alineado, el software recomendado es RSEM [33] que tambi&eacute;n facilita valores de normalizaci&oacute;n.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Expresi&oacute;n g&eacute;nica diferencial</b></i></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font color="#000000" size="2" face="Verdana">El an&aacute;lisis de expresi&oacute;n g&eacute;nica diferencial (DGE: por sus siglas en ingl&eacute;s) se refiere a la identificaci&oacute;n global de genes (transcriptoma) que se expresan significativamente en ciertas condiciones comparadas a un control experimental. DGE puede ser realizado para observar expresi&oacute;n g&eacute;nica entre diversos tejidos de un mismo organismo y as&iacute; detectar splicing alternativo [7], para conocer los cambios globales en diferentes estadios del desarrollo, organismos expuestos a diferentes condiciones qu&iacute;micas o biol&oacute;gicas, individuos sanos comparados con enfermos, y otros. Para realizar &eacute;ste an&aacute;lisis existen diferentes enfoques que vienen incluidos en software que usualmente est&aacute; basado en el lenguaje de programaci&oacute;n gratuito R [34]. Los dos programas m&aacute;s utilizados son edgeR [35] y DESeq que tienen una base de modelos lineares basado en un programa originalmente dise&ntilde;ado para estudiar Microarrays (Limma). Sin embargo, existen otras herramientas disponibles: Cufflinks [36], ALEXA-seq [37]. Las grandes cantidades de an&aacute;lisis m&uacute;ltiples que se realizan requieren de an&aacute;lisis estad&iacute;sticos avanzados para descubrir las tasas de descubrimientos falsos (False Discovery Rate: FDR por sus siglas en ingl&eacute;s) [38].</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>Anotaci&oacute;n gen&oacute;mica</b></i></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">La anotaci&oacute;n gen&oacute;mica en RNA-seq se refiere al proceso de identificaci&oacute;n de los genes expresados, y a conocer la informaci&oacute;n disponible sobre su funci&oacute;n en los genomas de referencia y bases de datos p&uacute;blicas.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">La ventaja de trabajar con genomas conocidos es que una buena parte de la anotaci&oacute;n gen&oacute;mica se realiza junto a la secuenciaci&oacute;n del genoma. Mientras que para genomas poco estudiados el proceso inicia realizando un alineamiento de las secuencias de genes que se identificaron como significativamente expresadas con software como BLAST [39]. Luego se procede a identificar las familias a las cuales los genes y sus productos pueden pertenecer mediante software como HMMER, InterProScan [40] y SignalP. Cuando se trabaja con transcriptomas <i>de novo, </i>es recomendado resumir &eacute;sta informaci&oacute;n con Trinotate.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana"><i><b>An&aacute;lisis de ontolog&iacute;a g&eacute;nica (GO)</b></i></font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">Grandes cantidad de genes requieren ser agrupados para conocer su significado biol&oacute;gico. Es as&iacute; que el an&aacute;lisis de ontolog&iacute;a g&eacute;nica <u>(GO</u> por sus siglas en ingl&eacute;s) nos permite agrupar genes por proceso biol&oacute;gico, funci&oacute;n molecular y componente celular. Adem&aacute;s tambi&eacute;n se puede analizar rutas metab&oacute;licas <u>(KEGG)</u> [41] y otras agrupaciones m&aacute;s complejas <u>(PANTHER)</u> [42]. Herramientas como <u>AgriGO</u> nos permiten visualizar mediante arboles jer&aacute;rquicos los t&eacute;rminos GO significativamente expresados.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">A trav&eacute;s de todos estos pasos, el an&aacute;lisis bioinform&aacute;tico de RNA-seq nos permite generar listas de todos los genes expresados y sus funciones para cada organismo y condici&oacute;n estudiada, nos permite identificar las inducciones o represiones en la expresi&oacute;n de los genes estudiados de manera cuantitativa y nos da la posibilidad de identificar SNPs en las secuencias de estos. Finalmente, la agrupaci&oacute;n de genes expresados nos da pautas acerca de patrones de co-expresi&oacute;n, cascadas de se&ntilde;alizaci&oacute;n y rutas metab&oacute;licas activadas o reprimidas durante la condici&oacute;n fisiol&oacute;gica dada.</font></p>     <p align="justify"><font color="#000000" size="2" face="Verdana">De todas maneras, los recursos computacionales para estos an&aacute;lisis a&uacute;n requieren grandes cantidades de memoria RAM y espacio en disco duro. Por ejemplo, la base de datos de secuencias en investigaci&oacute;n contra el C&aacute;ncer por si misma supera los 2 petabytes [43]. A su vez, estos an&aacute;lisis tambi&eacute;n necesitan un n&uacute;mero considerable de n&uacute;cleos que puedan funcionar constantemente, en algunos casos por d&iacute;as enteros. Por lo cual los an&aacute;lisis son generalmente realizados en cl&uacute;steres computacionales regionales o en computaci&oacute;n en la nube (Cloud Computing) mediante servicios web como el servicio web de Amazon (AWS) y otros servicios web de libre acceso (ej. Chipster [44] y Galaxy [45]). En lo que a nuestro conocimiento respecta, en Bolivia no existen cl&uacute;steres computacionales para investigaci&oacute;n bioinform&aacute;tica. Es por eso que hemos visto la necesidad de implementar un cl&uacute;ster computacional para investigaci&oacute;n bioinform&aacute;tica de libre acceso denominado CnCaBo. El objetivo de CnCaBo s proveer los recursos computacionales tanto en almacenamiento como en procesamiento para cumplir con las demandas que requieran los investigadores en gen&oacute;mica y bioinform&aacute;tica de toda Bolivia. CnCaBo cuenta con todo el software y hardware necesario para realizar RNA-seq, adem&aacute;s de una p&aacute;gina web que incluye gu&iacute;as bioinform&aacute;ticas y a la fecha se encuentra en l&iacute;nea y funcionando.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font color="#000000" size="3" face="Verdana"><b>RECONOCIMIENTOS</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font color="#000000" size="2" face="Verdana">Los autores agradecen a Sergio Alvarez Molina por su ayuda en la implementaci&oacute;n de CnCaBo, a Enzo Aliaga e Isabel Morales Belpaire por sus comentarios sobre el manuscrito. A la Agencia Sueca de cooperaci&oacute;n para el Desarrollo Internacional (SIDA) por el respaldo financiero.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font color="#000000" size="3" face="Verdana"><b>REFERENCIAS</b></font></p>     <!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">1.&nbsp; &nbsp; &nbsp; Desta, Z.A. & Ortiz, R. 2014, Genomic selection: genome-wide prediction in plant improvement, <i>Trenas in Plant Science, 19 </i>(9), 592-601.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690497&pid=S0250-5460201700020000200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">2.&nbsp; &nbsp; &nbsp; Varshney, R.K., Terauchi, R. & McCouch, S.R. 2014, Harvesting the Promising Fruits of Genomics: Applying Genome Sequencing Technologies to Crop Breeding, <i>PLOSBiology, 12 </i>(6), el001883.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690498&pid=S0250-5460201700020000200002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">3.&nbsp; &nbsp; &nbsp; Jannink, J.-L, Lorenz, A. J. & Iwata, H. 2010, Genomic selection in plant breeding: from theory to practice, <i>Briefings in Functional Genomics, 9 </i>(2), 166-177..</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690499&pid=S0250-5460201700020000200003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">4.&nbsp; &nbsp; &nbsp; Tang, F., Barbaciora, C, Wang, Y., Nordman, E., Lee, C, Xu, N., Wang, X., Bodeau, J., Tuch, B.B., Siddiqui, A., et al. 2009, mRNA-Seq whole-transcriptome analysis of a single cell, <i>Nature Methods, 6 </i>(5), 377-382.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690500&pid=S0250-5460201700020000200004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">5.&nbsp; &nbsp; &nbsp; Wang, Z., Gerstein, M. & Snyder, M. 2009, RNA-Seq: a revolutionary tool for transcriptomics, <i>Nature Reviews Genetics, 10 </i>(1), 57-63.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690501&pid=S0250-5460201700020000200005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">6.&nbsp; &nbsp; &nbsp; Zhao, S., Fung-Leung, W.-P., Bittner, A., Ngo, K. & Liu, X. 2014, Comparison of RNA-Seq and Microarray in Transcriptome Profiling of Activated T Cells, <i>PLOS ONE, </i>9(1), e78644.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690502&pid=S0250-5460201700020000200006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">7.&nbsp; &nbsp; &nbsp; Mortazavi, A., Williams, B.A., McCue, K., Schaeffer, L. & Wold, B. 2008, Mapping and quantifying mammalian transcriptomes by RNA-Seq, <i>Nature Methods, </i>5(7), 621-628.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690503&pid=S0250-5460201700020000200007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">8.&nbsp; &nbsp; &nbsp; Jain, M. 2012, Next-generation sequencing technologies for gene expression profiling in plants, <i>Briefings in Functional Genomics, 11 </i>(1), 63-70.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690504&pid=S0250-5460201700020000200008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">9.&nbsp; &nbsp; &nbsp; T&uuml;Rktas., M., Y&uuml;Cebilgili KurtogLu, K., Dorado, G, Zhang, B., Hern&aacute;ndez, P. & &uuml;Nver, T. 2015, Sequencing of plant genomes -areview, <i>Turkish Journal ofAgriculture and Forestry, 39, </i>361-376.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690505&pid=S0250-5460201700020000200009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">10.&nbsp; &nbsp; Grabherr, M.G., Haas, B.J., Yassour, M., Levin, J.Z., Thompson, D.A., Amit, I., Adiconis, X., Fan, L., Raychowdhury, R., Zeng, Q., et al. 2011, Full-length transcriptome assembly from RNA-Seq data without a reference genome, <i>Nature Biotechnology, 29 </i>(7), 644-652.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690506&pid=S0250-5460201700020000200010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">11.&nbsp; &nbsp; Ambardar, S., Gupta, R., Trakroo, D., Lal, R. & Vakhlu, J. 2016, High Throughput Sequencing: An Overview of Sequencing Chemistry, <i>Indian Journal of Microhiology, 56 (A), </i>394-404.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690507&pid=S0250-5460201700020000200011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">12.&nbsp; &nbsp; Mardis, E.R. 2013, Next-Generation Sequencing Platforms, <i>AnnualReviewof Analytical Chemistry, 6(1), </i>287-303.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690508&pid=S0250-5460201700020000200012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify"><font color="#000000" size="2" face="Verdana">13.&nbsp; &nbsp; Metzker, M.L. 2010, Sequencing technologies &mdash; the next generation, <i>Nature Reviews Genetics, 11 </i>(1), 31-46.</font></p>     <!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">14.&nbsp; &nbsp; Ozsolak, F. & Milos, P.M. 2011, RNA sequencing: advances, challenges and opportunities, <i>Nature Reviews Genetics, 12 </i>(2), 87-98.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690510&pid=S0250-5460201700020000200014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">15.&nbsp; &nbsp; Bentley, D.R. & Balasubramanian, S. & Swerdlow, H.P. & Smith, G.P. & Milton, J. & Brown, C.G. & Hall, K.P. & Evers, DJ. & Barnes, C.L. & Bignell, H.R., et al. 2008, Accurate whole human genome sequencing using reversible terminator chemistry, <i>Nature, 456(72X8), </i>53-59.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690511&pid=S0250-5460201700020000200015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">16.&nbsp; &nbsp; Schadt, E.E., Turner, S. & Kasarskis, A. 2010, A window into third-generation sequencing, <i>Human Molecular Genetics, 19 </i>(R2), R227-R240.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690512&pid=S0250-5460201700020000200016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">17.&nbsp; &nbsp; Fu, G.K., Xu, W., Wilhelmy, J., Mindrinos, M.N., Davis, R.W., Xiao, W. & Fodor, S.P.A. 2014, Molecular indexing enables quantitative targeted RNA sequencing and reve&aacute;is poor efficiencies in standard library preparations, <i>Proceedings ofthe National Academy of Sciences, 111 </i>(5), 1891-1896.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690513&pid=S0250-5460201700020000200017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">18.&nbsp; &nbsp; Eid, J., Fehr, A., Gray, J., Luong, K., Lyle, J., Otto, G., Peluso, P., Rank, D., Baybayan, P., Bettman, B., et al. 2009, Real-Time DNA Sequencing from Single Polymerase Molecules, <i>Science, 323 </i>(5910), 133-138.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690514&pid=S0250-5460201700020000200018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">19.&nbsp; &nbsp; Lo&oacute;se, M., Malla, S. & Stout, M. 2016, Real-time selective sequencing using nanopore technology, <i>Nature Methods, 13 </i>(9), 751-754.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690515&pid=S0250-5460201700020000200019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">20.&nbsp; &nbsp; Lipson, D., Raz, T., Kieu, A., Jones, D.R., Giladi, E., Thayer, E., Thompson, J.F., Letovsky, S., Milos, P. & Causey, M. 2009, Quantification ofthe yeast transcriptome by single-molecule sequencing, <i>Nature Biotechnology, 27 </i>(7), 652-658.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690516&pid=S0250-5460201700020000200020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">21.&nbsp; &nbsp; Haas, B.J., Papanicolaou, A., Yassour, M., Grabherr, M., Blood, P.D., Bowden, J., Couger, M.B., Eccles, D., Li, B., Lieber, M., et al. 2013, De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis, <i>Nature Protocols, 8(8), </i>1494-1512.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690517&pid=S0250-5460201700020000200021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">22.&nbsp; &nbsp; Langmead, B. & Salzberg, S.L. 2012, Fast gapped-read alignment with Bowtie 2, <i>Nature Methods, 9 </i>(4), 357-359.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690518&pid=S0250-5460201700020000200022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">23.&nbsp; &nbsp; Li, H. & Durbin, R. 2009, Fast and accurate short read alignment with Burrows-Wheeler transform, <i>B&iacute;o&iacute;nformat&iacute;cs, 25 </i>(14), 1754-1760.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690519&pid=S0250-5460201700020000200023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">24.&nbsp; &nbsp; Kim, D., Pertea, G., Trapnell, C, Pimentel, H., Kelley, R. & Salzberg, S.L. 2013, TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions, <i>Genome Biology, 14 </i>(4), R36.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690520&pid=S0250-5460201700020000200024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">25.&nbsp; &nbsp; Kim, D., Pertea, G., Trapnell, C, Pimentel, H., Kelley, R. & Salzberg, S.L. 2013, TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions, <i>Genome Biology, 14 (A), </i>R36.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690521&pid=S0250-5460201700020000200025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">26.&nbsp; &nbsp; Dobin, A., Davis, C.A., Schlesinger, F., Drenkow, J., Zaleski, C, Jha, S., Batut, P., Chaisson, M. & Gingeras, T.R. 2013, STAR: ultrafast universal RNA-seq aligner, <i>B&iacute;o&iacute;nformat&iacute;cs (Oxford, England), 29 </i>(1), 15-21.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690522&pid=S0250-5460201700020000200026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">27.&nbsp; &nbsp; Wu, T.D. & Nacu, S. 2010, Fast and SNP-tolerant detection of complex variants and splicing in short reads, <i>B&iacute;o&iacute;nformat&iacute;cs, 26 </i>(7), 873-881.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690523&pid=S0250-5460201700020000200027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">28.&nbsp; &nbsp; Li, R., Yu, C, Li, Y., Lam, T.W., Yiu, S.M., Kristiansen, K. & Wang, J. 2009, SOAP2: an improved ultrafast tool for short read alignment, <i>B&iacute;o&iacute;nformat&iacute;cs, 25 </i>(15), 1966-1967.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690524&pid=S0250-5460201700020000200028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">29.&nbsp; &nbsp; Bray, N.L., Pimentel, H., Melsted, P. & Pachter, L. 2016, Near-optimal probabilistic RNA-seq quantification, <i>Nature Biotechnology 34 </i>(5), 525-527.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690525&pid=S0250-5460201700020000200029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">30.&nbsp; &nbsp; Li, H. 2011, ImprovingSNP discovery by base alignment quality, <i>B&iacute;o&iacute;nformat&iacute;cs, 27 (8), </i>1157-1158.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690526&pid=S0250-5460201700020000200030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify"><font color="#000000" size="2" face="Verdana">31.&nbsp; &nbsp; Thorvaldsd&oacute;ttir, H., Robinson, J.T. & Mesirov, J.P. 2013, Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration, <i>Br&iacute;efings in h&iacute;o&iacute;nformat&iacute;cs, 14 </i>(2), 178-192.</font></p>     <!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">32.&nbsp; &nbsp; Anders, S., Pyl, P.T. & Huber, W. 2015, HTSeq-a Python framework to work with high-throughput sequencing data, <i>B&iacute;o&iacute;nformat&iacute;cs, 31 </i>(2), 166-169</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690528&pid=S0250-5460201700020000200032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">33.&nbsp; &nbsp; Li, B. & Dewey, C.N. 2011, RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome, <i>BMCBioinformatics, 12(1), </i>323.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690529&pid=S0250-5460201700020000200033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">34.&nbsp; &nbsp; R Core Team. 2016, R: A Language and Environment for Statistical Computing, Journal, (Issue).</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690530&pid=S0250-5460201700020000200034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">35.&nbsp; &nbsp; Robinson, M.D., McCarthy, DJ. & Smyth, G.K. 2010, edgeR: a Bioconductor package for differential expression analysis of digital gene expression data, <i>B&iacute;o&iacute;nformat&iacute;cs, 26 </i>(1), 139-140.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690531&pid=S0250-5460201700020000200035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">36.&nbsp; &nbsp; Trapnell, C, Roberts, A., Goff, L., Pertea, G., Kim, D., Kelley, D.R., Pimentel, H., Salzberg, S.L., Rinn, J.L. & Pachter, L. 2012, Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks, <i>Nature Protocols, 7 </i>(3), 562-578.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690532&pid=S0250-5460201700020000200036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">37.&nbsp; &nbsp; Griffith, M, Griffith, O.L., Mwenifumbo, J., Goya, R., Morrissy, A.S., Morin, R.D., Corbett, R., Tang, M.J., Hou, Y.-C, Pugh, T.J., et al. 2010, Alternative expression analysis by RNA sequencing, <i>Nature Methods, </i>7(10), 843-847.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690533&pid=S0250-5460201700020000200037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">38.&nbsp; &nbsp; Benjamini, Y. & Hochberg, Y. 1995, Controlling the False Discovery Rate: A Practical and Powerful Approach to M&uacute;ltiple Testing, <i>Journal o&iacute; the Royal Statistical Society. Series B (Methodological), </i>57(1), 289-300.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690534&pid=S0250-5460201700020000200038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">39.&nbsp; &nbsp; Camacho, C, Coulouris, G., Avagyan, V., Ma, N., Papadopoulos, J., Bealer, K. & Madden, T.L. 2009, BLAST+: architecture and applications, <i>BMC B&iacute;o&iacute;nformat&iacute;cs, 10 </i>(1), 421.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690535&pid=S0250-5460201700020000200039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">40.&nbsp; &nbsp; Mitchell, A., Chang, H.Y., Daugherty, L, Fraser, M, Hunter, S., L&oacute;pez, R., McAnulla, C, McMenamin, C, Nuka, G., Pesseat, S., et al. 2015, The InterPro protein families dat&aacute;base: the classification resource after 15 years, <i>Nucleic Acids Research, 43 </i>(D1),D213-D221.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690536&pid=S0250-5460201700020000200040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">41.&nbsp; &nbsp; Kanehisa, M. 2004, The KEGG resource for deciphering the genome, <i>Nucleic Acids Research, </i>32(90001), 277-280.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690537&pid=S0250-5460201700020000200041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">42.&nbsp; &nbsp; Mi, H., Muruganujan, A., Casagrande, J.T. & Thomas, P.D. 2013, Large-scale gene function analysis with the PANTHER classification system, <i>Nature Protocols, 8(8), </i>1551-1566.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690538&pid=S0250-5460201700020000200042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">43.&nbsp; &nbsp; Muir, P., Li, S., Lou, S., Wang, D., Spakowicz, D.J., Salichos, L., Zhang, J., Weinstock, G.M., Isaacs, F., Rozowsky, J., et al. 2016, The real cost of sequencing: scaling computation to keep pace with data generation, <i>Genome Biology, 17 </i>(1).</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690539&pid=S0250-5460201700020000200043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">44.&nbsp; &nbsp; Kallio, M.A., Tuimala, J.T., Hupponen, T., R&iacute;emela, P., Gentile, M., Scheinin, I., Koski, M., Kaki, J. & Korpelainen, E.I. 2011, Chipster: user-friendly analysis software for microarray and other high-throughput data, <i>BMC Genomics, 12 </i>(1), 507.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690540&pid=S0250-5460201700020000200044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">45.&nbsp; &nbsp; Afgan, E., Baker, D., van den Beek, M., Blankenberg, D., Bouvier, D., Cech, M., Chilton, J., Clements, D., Coraor, N., Eberhard, C, et al. 2016, The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update, <i>Nucleic Acids Research, 44 </i>(Wl), W3-W10.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690541&pid=S0250-5460201700020000200045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">46.&nbsp; &nbsp; Xu, X., Pan, S., Cheng, S., Zhang, B., Mu, D., Ni, P., Zhang, G., Yang, S., Li, R., Wang, J., et al. 2011, Genome sequence and analysis of the tuber crop potato, <i>Nature, 475 </i>(7355), 189-195.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690542&pid=S0250-5460201700020000200046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">47.&nbsp; &nbsp; Motamayor, J.C., Mockaitis, K., Schmutz, J., Haiminen, N., Livingstone Iii, D., Cornejo, O., Findley, S., Zheng, P., Utro, F., Royaert, S., et al. 2013, The genome sequence of the most widely cultivated cacao type and its use to identify candidate genes regulating pod color, <i>Genome biology, 14 </i>(6): r53.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690543&pid=S0250-5460201700020000200047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">48.&nbsp; &nbsp; Argout, X., Salse, J., Aury, J.M., Guiltinan, M.J., Droc, G., Gouzy, J., Allegre, M., Chaparro, C, Legavre, T., Maximova, S.N., et al. 2011, The genome of Theobroma cacao, <i>Nature Genet&iacute;cs, 43 </i>(2), 101-108.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690544&pid=S0250-5460201700020000200048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">49.&nbsp; &nbsp; Clouse, J.W., Adhikary, D., Page, J.T., Ramaraj, T., Deyholos, M.K., Udall, J.A., Fairbanks, D.J., Jellen, E.N. & Maughan, PJ. 2016, The Amaranth Genome: Genome, Transcriptome, and Physical Map Assembly, <i>The Plant Genome, 9 </i>(1), doi: 10.3835/plantgenome2015.07.0062.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690545&pid=S0250-5460201700020000200049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">50.&nbsp; &nbsp; Yasui, Y., Hirakawa, H., Oikawa, T., Toyoshima, M., Matsuzaki, C, Ueno, M., Mizuno, N., Nagatoshi, Y., Imamura, T., Miyago, M., et al. 2016, Draft genome sequence of an inbred line of <i>Chenopodium quinoa</i> , an allotetraploid crop with great environmental adaptability and outstanding nutritional properties, <i>DNA Research, </i>dswO37.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690546&pid=S0250-5460201700020000200050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font color="#000000" size="2" face="Verdana">51.&nbsp; &nbsp; Jarvis, D.E., Ho, Y.S., Lightfoot, D.J., Schm&oacute;ckel, S.M., Li, B., Borm, T.J.A., Ohyanagi, H., Mineta, K., Michell, C.T., Saber, N., et al. 2017, The genome of Chenopodium quinoa, <i>Nature, 542 </i>(7641), 307-312.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=690547&pid=S0250-5460201700020000200051&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify">&nbsp;</p>     <p align="justify">&nbsp;</p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Desta]]></surname>
<given-names><![CDATA[Z.A]]></given-names>
</name>
<name>
<surname><![CDATA[Ortiz]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genomic selection: genome-wide prediction in plant improvement]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>592-601</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Varshney]]></surname>
<given-names><![CDATA[R.K.]]></given-names>
</name>
<name>
<surname><![CDATA[Terauchi]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[McCouch]]></surname>
<given-names><![CDATA[S.R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Harvesting the Promising Fruits of Genomics: Applying Genome Sequencing Technologies to Crop Breeding]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jannink]]></surname>
<given-names><![CDATA[J.-L]]></given-names>
</name>
<name>
<surname><![CDATA[Lorenz]]></surname>
<given-names><![CDATA[A. J]]></given-names>
</name>
<name>
<surname><![CDATA[Iwata]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genomic selection in plant breeding: from theory to practice, Briefings in Functional Genomics]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>166-177</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tang]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[mRNA-Seq whole-transcriptome analysis of a single cell]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>377-382</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RNA-Seq: a revolutionary tool for transcriptomics, Nature Reviews Genetics]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhao]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comparison of RNA-Seq and Microarray in Transcriptome Profiling of Activated T Cells]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mortazavi]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[B.A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mapping and quantifying mammalian transcriptomes by RNA-Seq, Nature Methods,]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>621-628</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jain]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Next-generation sequencing technologies for gene expression profiling in plants, Briefings in Functional Genomics]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>63-70</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TüRktas]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sequencing of plant genomes -areview, Turkish Journal ofAgriculture and Forestry]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>361-376.</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Grabherr]]></surname>
<given-names><![CDATA[M.G]]></given-names>
</name>
<name>
<surname><![CDATA[Haas]]></surname>
<given-names><![CDATA[B.J]]></given-names>
</name>
<name>
<surname><![CDATA[Yassour]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Full-length transcriptome assembly from RNA-Seq data without a reference genome, Nature Biotechnology]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>644-652</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ambardar]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Gupta]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[High Throughput Sequencing: An Overview of Sequencing Chemistry, Indian Journal of Microhiology]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>394-404</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mardis]]></surname>
<given-names><![CDATA[E.R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Next-Generation Sequencing Platforms, AnnualReviewof Analytical Chemistry]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>287-303</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Metzker]]></surname>
<given-names><![CDATA[M.L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sequencing technologies - the next generation, Nature Reviews Genetics]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>31-46</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ozsolak]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Milos]]></surname>
<given-names><![CDATA[P.M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RNA sequencing: advances, challenges and opportunities]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>87-98</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bentley]]></surname>
<given-names><![CDATA[D.R]]></given-names>
</name>
<name>
<surname><![CDATA[Balasubramanian]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Accurate whole human genome sequencing using reversible terminator chemistry, Nature]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>53-59</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schadt,]]></surname>
<given-names><![CDATA[E.E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A window into third-generation sequencing, Human Molecular Genetics]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wilhelmy]]></surname>
</name>
</person-group>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eid]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Fehr]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Real-Time DNA Sequencing from Single Polymerase Molecules, Science]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>133-138</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Loóse]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Malla]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Real-time selective sequencing using nanopore technology, Nature Methods]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>751-754</page-range></nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lipson]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Raz]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Quantification ofthe yeast transcriptome by single-molecule sequencing, Nature Biotechnology]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>652-658</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Haas,]]></surname>
<given-names><![CDATA[B.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Langmead]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fast gapped-read alignment with Bowtie 2]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fast and accurate short read alignment with Burrows-Wheeler transform]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kim]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kim]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions, Genome Biology]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dobin]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[STAR: ultrafast universal RNA-seq aligner]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wu]]></surname>
<given-names><![CDATA[T.D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fast and SNP-tolerant detection of complex variants and splicing in short reads]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<page-range>873-881</page-range></nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Yu]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[SOAP2: an improved ultrafast tool for short read alignment]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bray]]></surname>
<given-names><![CDATA[N.L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[, Near-optimal probabilistic RNA-seq quantification]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B30">
<label>30</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[ImprovingSNP discovery by base alignment quality,]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B31">
<label>31</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Thorvaldsdóttir]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[J.T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B32">
<label>32</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anders]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[HTSeq-a Python framework to work with high-throughput sequencing data]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B33">
<label>33</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Dewey]]></surname>
<given-names><![CDATA[C.N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B34">
<label>34</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[R]]></surname>
<given-names><![CDATA[Core]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Language and Environment for Statistical Computing]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B35">
<label>35</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[M.D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[edgeR: a Bioconductor package for differential expression analysis of digital gene expression data]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B36">
<label>36</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Trapnell]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Roberts]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B37">
<label>37</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Griffith]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Alternative expression analysis by RNA sequencing]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B38">
<label>38</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Benjamini]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Controlling the False Discovery Rate: A Practical and Powerful Approach to Múltiple Testing, Journal oí the Royal Statistical Society]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B39">
<label>39</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Camacho]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B40">
<label>40</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mitchell]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The InterPro protein families datábase: the classification resource after 15 years, Nucleic Acids Research]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B41">
<label>41</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kanehisa]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The KEGG resource for deciphering the genome]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B42">
<label>42</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mi]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Large-scale gene function analysis with the PANTHER classification system]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B43">
<label>43</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Muir]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The real cost of sequencing: scaling computation to keep pace with data generation]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B44">
<label>44</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kallio]]></surname>
<given-names><![CDATA[M.A]]></given-names>
</name>
<name>
<surname><![CDATA[Tuimala]]></surname>
<given-names><![CDATA[J.T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Chipster: user-friendly analysis software for microarray and other high-throughput data]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B45">
<label>45</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Afgan]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update, Nucleic Acids Research]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B46">
<label>46</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xu]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[2011, Genome sequence and analysis of the tuber crop potato, Nature]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B47">
<label>47</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Motamayor]]></surname>
<given-names><![CDATA[J.C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The genome sequence of the most widely cultivated cacao type and its use to identify candidate genes regulating pod color]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B48">
<label>48</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Argout]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Salse]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The genome of Theobroma cacao, Nature Genetícs]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B49">
<label>49</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Clouse]]></surname>
<given-names><![CDATA[J.W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Amaranth Genome: Genome, Transcriptome, and Physical Map Assembly]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B50">
<label>50</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Yasui]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Draft genome sequence of an inbred line of Chenopodium quinoa , an allotetraploid crop with great environmental adaptability and outstanding nutritional properties]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B51">
<label>51</label><nlm-citation citation-type="">
<article-title xml:lang="en"><![CDATA[The genome of Chenopodium quinoa]]></article-title>
<source><![CDATA[]]></source>
<year></year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
