banner
Hogar / Blog / Multi
Blog

Multi

Jul 13, 2023Jul 13, 2023

Biología de las comunicaciones volumen 6, número de artículo: 820 (2023) Citar este artículo

7566 Accesos

3 altmétrico

Detalles de métricas

La chía (Salvia hispanica) es un cultivo emergente considerado un alimento funcional que contiene sustancias importantes con múltiples aplicaciones potenciales. Sin embargo, aún queda por descubrir la base molecular de algunas características relevantes de la chía, como el mucílago de las semillas y el contenido de polifenoles. Este estudio genera una referencia mejorada a nivel cromosómico del genoma de la chía, resolviendo algunas regiones altamente repetitivas, describiendo patrones de metilación y refinando la anotación del genoma. El análisis transcriptómico muestra que las semillas exhiben un patrón de expresión único en comparación con otros órganos y tejidos. Por lo tanto, se implementa un enfoque metabólico y proteómico para estudiar la composición de las semillas y el mucílago producido por las semillas. El genoma de la chía muestra una expansión significativa en los genes de síntesis de mucílago (en comparación con Arabidopsis), y el análisis de la red genética revela reguladores potenciales que controlan la producción de mucílago en las semillas. El ácido rosmarínico, un compuesto con enorme potencial terapéutico, fue clasificado como el polifenol más abundante en las semillas y se describen genes candidatos para su compleja vía. En general, este estudio proporciona información importante sobre la base molecular de las características únicas de las semillas de chía.

El género Salvia, que incluye aproximadamente 900 especies, es el género más grande dentro de la familia de la menta (Lamiaceae)1. Salvia representa uno de los géneros más diversos de plantas con flores que comprende varias especies de importancia económica. En general, se cultivan en todo el mundo con fines ornamentales, como hierbas culinarias o como aromatizantes2, y algunas son conocidas por sus propiedades terapéuticas como agentes antitumorales, antialérgicos, antioxidantes o antimicrobianos3. Además, el consumo de semillas de una especie de Salvia comúnmente conocida como chía, Salvia hispanica, ha ganado popularidad como alimento funcional o “superalimento” en las últimas décadas4. Además de su alto valor nutricional, las semillas de chía contienen varios compuestos bioactivos con propiedades promotoras de la salud5. Las semillas de chía se caracterizan por su importante cantidad de ácidos grasos esenciales, alto contenido en proteínas, compuestos antioxidantes y alto contenido en fibra dietética4,6. Por tanto, las semillas de esta especie tienen un gran potencial en la industria alimentaria para potenciar el valor nutricional de diferentes productos. Además, sus derivados (aceite, harina, extractos, gomas, etc.) pueden utilizarse como estabilizadores de espuma y emulsionantes o como fuente de antioxidantes naturales para disminuir la oxidación de lípidos y proteínas en alimentos procesados7. En el escenario actual de cambio climático, S. hispanica también se ha propuesto como cultivo alternativo por su capacidad de crecer en ambientes áridos y semiáridos8.

Las semillas de Salvia hispanica también representan una fuente de mucílago, una vaina gelatinosa que rodea la semilla cuando se hidrata, a la que se le han asignado varias propiedades nutracéuticas. El mucílago de la semilla es una matriz compuesta de polisacáridos, y el mucílago de la semilla de chía se compone principalmente de residuos de xilosa, glucosa, arabinosa, galactosa, ácido glucurónico y ácido galacturónico9. El mucílago de chía ya se utiliza en la industria alimentaria como aditivo en diferentes preparaciones10. Por sus propiedades físicas y químicas, algunos estudios prevén un alto potencial del mucílago de chía como biopolímero en las industrias cosmética y farmacéutica11. Además, las semillas de chía tienen una alta actividad antioxidante comparable a la de los productos antioxidantes comerciales12, lo que sugiere que las semillas de chía representan una importante fuente dietética de antioxidantes. Diferentes estudios han reportado la presencia de compuestos con actividad antioxidante en las semillas de chía, entre ellos varios flavonoles y compuestos fenólicos12,13,14. Entre los antioxidantes, se informó anteriormente que el ácido rosmarínico (AR) es el compuesto fenólico más abundante en las semillas de chía14, que ya se utiliza en la industria alimentaria como antioxidante o conservante natural. Por lo tanto, se han realizado varios esfuerzos para establecer la producción a gran escala de RA utilizando cultivos de plantas in vitro15.

Debido a las propiedades nutracéuticas y las aplicaciones industriales de la semilla de chía, existe un interés creciente en estudiar S. hispanica para comprender la base genética de rasgos económicamente importantes. Aún es necesario descubrir la base genética de las características relacionadas con las semillas, como la producción de mucílago o el metabolismo de los polifenoles (por ejemplo, la biosíntesis de RA). Por tanto, desarrollar un genoma de referencia de alta calidad es esencial para caracterizar los mecanismos moleculares detrás de las propiedades funcionales de las semillas de chía. En consecuencia, en el presente estudio produjimos un ensamblaje del genoma de S. hispanica a nivel de cromosomas de alta calidad utilizando Oxford Nanopore y secuenciación Hi-C. Este ensamblaje mejorado permitió la identificación de la mayoría de las regiones centroméricas y algunas regiones teloméricas y la reubicación de un fragmento cromosómico en comparación con un ensamblaje del genoma de chía previamente informado16. Nuestra anotación del genoma de alta calidad reveló una expansión en el número de copias de los genes implicados en la biosíntesis del mucílago de las semillas en comparación con los genes informados anteriormente en Arabidopsis thaliana. Este estudio también identificó posibles reguladores que controlan la producción de mucílago en las semillas de chía. Además, realizamos análisis metabólicos y proteómicos para describir los componentes específicos de las semillas. Un enfoque combinado que integra vías metabolómicas y datos transcriptómicos permitió la identificación de genes de chía supuestamente involucrados en la síntesis de RA, uno de los antioxidantes más utilizados y económicamente importantes en la industria alimentaria.

Se obtuvo una referencia de alta calidad del genoma de S. hispanica utilizando una combinación de lecturas ultralargas de Oxford Nanopore Technologies (ONT) (46,68 Gb), lecturas de extremos emparejados de Illumina (54,87 Gb) y secuenciación Hi-C (25,13 Gb). ) para una cobertura total de alrededor de 350 × (Tabla complementaria S1). El tamaño del genoma de esta variedad mexicana de S. hispanica (Figura complementaria S1) se estimó en 358,3 Mb mediante análisis de frecuencia de k-mer (Figura complementaria S2). Se evaluaron varios procesos de ensamblaje para construir un genoma de chía de referencia de alta calidad (Tabla complementaria S2). Entre ellos, el ensamblador NECAT17 produjo el ensamblaje del genoma más contiguo (contig N50 = 5,37 Mb) y completo (BUSCO completo 97,8%), que fue elegido para análisis adicionales. Se obtuvo un ensamblaje mejorado después de seis pasos de pulido usando lecturas de Illumina con Pilon18 y posteriormente procesado con Purge Haplotigs para identificar contigs primarios19. Finalmente, se utilizaron datos de Hi-C para lograr un ensamblaje a nivel de cromosoma utilizando las tuberías Juicer20 y 3D-DNA21 (Figura complementaria S3). Este conjunto de genoma de referencia estaba compuesto por 269 cóntiges integrados en 154 andamios con una longitud total de 351,98 Mb y un andamio N50 de 61,89 Mb (Fig. 1a; Tabla complementaria S3), con el 98,5% del conjunto de datos de embriofitos de BUSCO22 determinado como completo. (Fig. 1b; Tabla complementaria S4). La mayor parte del conjunto estaba anclado en seis pseudocromosomas (345,52 de 351,98 Mb; Tabla complementaria S5). El análisis del genoma de S. hispanica con Tandem Repeats Finder23 y nhmmer (hmmer.org) permitió la identificación de centrómeros en cinco de los seis cromosomas (Fig. 1a; Tabla complementaria S6). La repetición centromérica más común en los cromosomas de chía tiene una longitud de 171 pb, pero también se identificaron variantes de 167 y 174 pb (Tabla complementaria S7). La repetición telomérica típica de la planta se identificó en un extremo de dos cromosomas (TTTAGGG en chr1 y chr5; Figura complementaria S4). Otras variantes teloméricas se colocaron en un extremo en dos cromosomas adicionales (CTAAACC en chr2 y AAACCCT en chr6; Figura complementaria S4).

a Características y métricas del ensamblaje del genoma de chía. La pista 1 muestra el número de cromosomas y su longitud (Mb), la pista 2 muestra la densidad genética (verde) y los elementos repetitivos (gris), la pista 3 muestra los patrones de metilación (distribución de 5 mC) por ventanas de 100 kb. Ubicaciones aproximadas de los centrómeros indicadas por triángulos rojos y métricas de referencia del genoma final (centro). b Completitud del genoma de alto nivel indicada por ortólogos de embriofitos conservados. c Sintenia con líneas que representan genes homólogos para la producción de mucílago entre A. thaliana (Ath) y S. hispanica (Shispa). Las líneas azules resaltan la expansión de los genes de síntesis de mucílago en el genoma de la chía.

La alineación de nuestro ensamblaje del genoma de S. hispanica con un genoma publicado previamente de una variedad de chía australiana mostró una alta colinealidad entre los cromosomas de los dos ensamblajes. La única diferencia significativa entre los dos conjuntos del genoma de chía es que un extremo del cromosoma chr1 (un fragmento de 4,6 Mb) de la variedad mexicana fue asignado al cromosoma chr2 de la variedad australiana (Figura complementaria S5), lo que sugiere que este fragmento fue mal ensamblado. Este fragmento se separó del cromosoma y se realizaron análisis utilizando dos conjuntos de datos Hi-C diferentes para resolver la ubicación genómica correcta de esta región. Estos análisis mostraron alineamientos emparejados Hi-C significativamente mayores entre este fragmento con chr1 que los contactos con chr2, lo que indica que este fragmento genómico pertenece efectivamente a chr1 (Figura complementaria S6). Recientemente se publicó la secuencia del genoma de otro cultivar mexicano de S. hispanica (semillas blancas)39. Este fragmento genómico de 4,6 Mb también fue asignado a chr1 en este otro genoma de S. hispanica, corroborando el resultado de nuestros análisis. El alineamiento del genoma utilizando este otro cultivar mexicano también mostró una alta colinealidad entre ensamblajes. Sin embargo, los resultados de este análisis indican una mayor identidad de nucleótidos entre el ensamblaje generado en este estudio con la variedad australiana que la otra variedad mexicana publicada por Li et al.39 (Figura complementaria S5).

Se anotaron un total de 179,88 Mb como secuencias repetitivas, que comprenden alrededor del 51,1% del genoma de S. hispanica. La mayoría de los elementos repetitivos se clasificaron como repeticiones terminales largas (LTR), ocupando aproximadamente 58,82 Mb del genoma. Estos están compuestos principalmente por retroelementos de las clases Gypsy y Copia (32,10 y 26,44 Mb, respectivamente). Las secuencias repetitivas del genoma de S. hispanica se enmascararon antes de la anotación estructural. Los modelos genéticos se predijeron utilizando el proceso MAKER-P25,26, incluidos métodos de predicción de genes ab initio y basados ​​en homología. La anotación dio como resultado 34.748 genes codificadores de proteínas en el genoma de S. hispanica, con una longitud media de gen de 2.828,35 pb y un promedio de 5,6 exones por gen. El conjunto de genes predichos incluye el 97% del núcleo de embriofitos BUSCO22 como genes completos que indican un alto nivel de integridad del genoma (Figura complementaria S7). Este conjunto de genes también tiene una distancia promedio de edición de anotaciones (AED) de 0,15, lo que indica una alta concordancia entre la evidencia de respaldo y la anotación.

Para obtener información sobre los patrones de metilación del genoma de la chía, determinamos la metilación de la citosina en la posición de carbono 5 (5-metilcitosina, 5 mC) utilizando ONT. Las lecturas ONT sin procesar se procesaron de acuerdo con el proceso DeepSignal27. Se obtuvieron aproximadamente 15 millones de 5 mC a partir de cuatro secuenciaciones independientes de Nanopore, de las cuales el 92 % se filtraron como posiciones de 5 mC de alta calidad. La fracción relativa de 5 mC identificada en cada contexto de secuencia para estas posiciones de alta calidad fue CG = 45 %, CHG = 19,6 % y CHH = 35,4 %, donde H es cualquiera de las bases A, T o C (Figura complementaria). S8). El análisis del genoma completo de 5 mC revela altos niveles de metilación del ADN en regiones genómicas con baja densidad genética y alto contenido de secuencias repetitivas, mientras que muestra niveles de metilación relativamente más bajos dentro de regiones ricas en genes (Fig. 1a). En la mayoría de los casos, las posiciones del centrómero se identificaron cerca del valor máximo de recuentos de 5 mC (Figura complementaria S9). Se evaluaron los niveles de metilación del ADN (%) para los genes de chía y mostraron que se observaron niveles bajos en los límites de los cuerpos genéticos cerca de los codones de inicio y finalización de la traducción en todos los contextos de secuencia; estos niveles aumentan en el cuerpo genético predominantemente en el contexto CG y para en menor medida en la metilación de CHG y CHH. Por el contrario, la metilación del ADN de secuencias de ADN repetitivas, como los elementos transponibles (TE), mostró niveles de metilación del ADN más altos en los tres contextos de metilación (Figura complementaria S8).

El análisis de la expresión génica de datos de secuencia de ARN publicados previamente de etapas clave de crecimiento vegetativo y reproductivo de S. hispanica28 mostró un patrón de expresión significativamente distinto para las semillas de chía (Fig. 2a); El 20,75% de los genes de chía tienen su expresión máxima en las semillas (valores de CPM, puntuación Z normalizada) (Figura complementaria S10). El análisis de enriquecimiento de genes altamente expresados ​​en semillas incluyó una amplia variedad de procesos biológicos, incluidas categorías relacionadas con las semillas, como el desarrollo embrionario y términos de estrés abiótico, como la respuesta al estrés salino y la aclimatación al calor, entre otros (Figura complementaria S11).

a Análisis de componentes principales de perfiles de expresión en diferentes tejidos y etapas durante el ciclo de vida de S. hispanica. Los valores de expresión se normalizaron y transformaron a puntuación Z antes del análisis de componentes principales. b Análisis del metaboloma de semillas secas de chía, composición química distribuida en principales grupos funcionales. Cotiledón y brote a los 3 días (3D); primordios foliares (LP) y disparar a 12D; 1.ª y 2.ª hojas (P1P2), 3.ª y 4.ª hojas (P3P4), 5.ª, 6.ª y 7.ª hojas (P5P6P7) y entrenudo a 69D; inflorescencia en racimo de la mitad superior o inferior en 158D; flores en 159D; flores en 164D; semillas secas. Descripción detallada del material vegetal en la Tabla complementaria S8.

Para asociar los perfiles transcripcionales con la composición de las semillas, realizamos análisis metabolómicos y proteómicos de semillas maduras. El análisis lipidómico de semillas identificó casi 1000 moléculas de lípidos que podrían agruparse en diez categorías (Figura complementaria S12). La clase de lípidos más abundante comprendía los triacilgliceroles, de los cuales las cadenas laterales de acilo C18 con cero a ocho enlaces insaturados eran las más comunes (Figura complementaria S12). El análisis metabolómico de las semillas de S. hispanica identificó un total de 1.984 características, de las cuales el compuesto más abundante fue el ácido (R)-(+)-rosmarínico, seguido de la oleamida, la α-trehalosa, la 3-hidroxicumarina, el ácido treónico, la estaquiosa y la buchananina. , L-α-glicerilfosforilcolina, ácido α-linolénico, L-fenilalanina y ácido palmitoleico (Tabla complementaria S9). Los resultados del metaboloma del análisis de la semilla de chía se resumen en la Fig. 2b por el grupo funcional principal de cada compuesto.

Los polifenoles fueron el cuarto grupo químico más abundante de las semillas maduras, con el 15% del área cromatográfica. Entre los polifenoles, la abundancia de RA fue significativamente mayor que la de otros polifenoles (Fig. 3). La base de datos MetaCyc se utilizó como referencia para identificar la vía metabólica y las enzimas involucradas en la biosíntesis de la AR. Dado que la síntesis de RA en plantas es una vía compleja que involucra varias enzimas, sustratos y productos de reacción29, implementamos una nomenclatura simplificada de sus reacciones, como se indica en la Fig. 3. Brevemente, comienza con L-tirosina (denominada reacciones A1 -2) o de L-fenilalanina (reacciones B1-3), el producto de estas dos vías se convierte en 4-cumaroil-4'-hidroxifenillactato (reacción C1), y este precursor se hidroxila en diferentes posiciones para formar RA. Aún así, esta última conversión no ha sido completamente descrita (reacciones D1-2 o E1-2). Casi todos los precursores e intermedios de la AR (9 de 10) se detectaron en nuestro análisis metabolómico (Fig. 3). Se examinaron genes anotados en el genoma de S. hispanica para identificar genes con función enzimática utilizando el software Ensemble Enzyme Prediction Pipeline (E2P2)30. Los genes de chía que codifican enzimas potencialmente implicadas en la vía de la AR se identificaron mediante la anotación del número EC. Esta selección identificó 19 y 22 genes de S. hispanica con supuesta actividad enzimática para las reacciones A1-2 y B1-3, respectivamente (Fig. 4a; Tabla complementaria S10). Sin embargo, este análisis no identificó genes específicos para el paso C1; luego, se buscaron genes candidatos para esta reacción (EC 2.3.1.140) utilizando genes de la ácido rosmarínico sintasa de Salvia miltiorrhiza y Melissa officinalis previamente informados31,32 utilizando BLASTP. Este cribado identificó 57 genes candidatos para la reacción C1. Se identificaron cincuenta y seis genes candidatos para la última reacción de síntesis de RA, reacciones D1-2/E1-2 (Fig. 4a; Tabla complementaria S10). Para definir mejor a los candidatos para los dos últimos pasos de síntesis de RA, se examinó la expresión génica en diferentes tejidos y etapas de desarrollo (indicadas como muestras de "ciclo de vida" en la Tabla complementaria S8). Este análisis mostró que 7 de estos 113 genes tenían su nivel máximo de expresión en la semilla en comparación con otros tejidos (Fig. 4b). Por lo tanto, estos resultados permitieron la identificación de 48 genes como candidatos primarios para la síntesis de RA en semillas de S. hispanica (19, 22, 5 y 2 genes para las reacciones A1-2, B1-3, C1 y D1-2/E1-2). , respectivamente; Tabla complementaria S10), lo que sugiere que las vías de la AR están codificadas por varias familias multigénicas.

El análisis del metaboloma indicó que el ácido rosmarínico (RA) es el compuesto más abundante en las semillas de chía. El RA también se acumula en cantidades mucho mayores en comparación con otros polifenoles (gráfico circular; centro). Se representa la ruta de biosíntesis de la AR, indicando los precursores identificados mediante el análisis metabólico y su relativa abundancia en las semillas de chía. La nomenclatura para indicar las reacciones de la vía se representa como cuadros azules. Los datos de origen numéricos para los polifenoles se proporcionan en la Tabla complementaria S9.

a Representación simplificada de la ruta de síntesis del ácido rosmarínico (RA) y el número de genes en S. hispanica con actividad enzimática potencial para cada reacción. b Enfoque para reducir el número de genes candidatos para la última parte de la vía de la AR seleccionando los genes altamente expresados ​​en las semillas de chía (rectángulo discontinuo). Perfiles de expresión (puntuación Z normalizada) de genes de AR en diferentes tejidos durante el ciclo de vida de S. hispanica. Las elipses discontinuas indicaron candidatos principales para las reacciones C1, D1/D2 y E1/E2. Las descripciones y abreviaturas de los ejemplos son similares a las de la Fig. 2.

Los genes supuestamente implicados en la producción y liberación de mucílago de las semillas de S. hispanica se identificaron utilizando un conjunto de genes específicos de mucílago previamente informados para las semillas de Arabidopsis thaliana33. Un enfoque BLASTP basado en homología identificó 108 genes relacionados con el mucílago en S. hispanica (Tabla complementaria S11 y Fig. S13). Los genes relacionados con el mucílago con un número significativo de copias en el genoma de la chía incluyen CSLA2 (6 copias), CESA2 (5 copias) y ADK1, COBL2, MUM4/RHM2 y RRT1 (todos ellos con cuatro copias) (Figura complementaria. S13). Estos genes se clasificaron según su función propuesta en a) síntesis de mucílago, b) modificación de mucílago, c) estabilización de mucílago y d) secreción de mucílago, o involucrados en e) síntesis y modificación de la pared celular, f) síntesis y percepción de hormonas, y g ) vías transcripcionales (Fig. 5a). Este análisis mostró que los genes que pertenecen a la categoría de síntesis de mucílago se expandieron significativamente en el genoma de la chía (28 genes en comparación con los 12 reportados en A. thaliana). De estos, solo dos pares de genes se identificaron como duplicaciones de genes en tándem, los homólogos de los genes de síntesis de mucílago de Arabidopsis CSLA2 y GAUT11 (Tabla complementaria S11). Utilizando los datos de RNA-seq disponibles, se examinó la expresión genética de genes relacionados con el mucílago durante el desarrollo de la semilla a los 3, 7, 14, 21 y 28 días después de la floración (DAF)34. Este análisis mostró que 72 de 108 genes relacionados con el mucílago exhiben una expresión máxima en 7 DAF (Fig. 5b). Todas las categorías de genes de mucílago se ampliaron en el genoma de chía con respecto al número de genes en Arabidopsis, excepto el grupo de factores de transcripción (TF). Por lo tanto, se realizó un análisis de la red reguladora de genes para identificar TF que podrían regular la producción de mucílago en las semillas de chía. Se construyó una red de correlación de genes ponderada utilizando el canal RegEnrich35, que luego se filtró para retener el 5% superior de las correlaciones de genes TF más altas que incluían genes relacionados con el mucílago (Fig. 6). La red resultante comprende 16 genes reguladores potenciales de la producción de mucílago de semillas de chía, incluidos miembros de las familias de factores de transcripción AP2, ARF, bHLH, bZIP, C3H, GRF, NAC, MIKC MADS, MYB y TALE. En particular, este análisis identificó homólogos de cinco TF previamente reportados como reguladores del metabolismo del mucílago en semillas de Arabidopsis (Fig. 6).

a Número de genes relacionados con el mucílago en Arabidopsis thaliana (verde) y sus homólogos identificados en S. hispanica (azul). Los genes se agruparon según su función propuesta o tipo de gen. b Perfil de expresión de genes relacionados con el mucílago durante el desarrollo de semillas en S. hispanica. Expresión génica (puntuación Z normalizada) en diferentes días después de la floración (DAF).

El análisis de la red reguladora de genes permitió la identificación de factores de transcripción (TF) con correlaciones significativas con genes relacionados con el mucílago. Los FT propuestos que actúan como reguladores de la producción de mucílago en S. hispanica se indican en diamantes rojos. La tabla indica el homólogo de Arabidopsis de cada TF, y se ha informado previamente que los que se muestran en negrita (*) participan en la síntesis de mucílago de la semilla. La inferencia de red se realizó utilizando el paquete RegEnrich. Los genes se representan como círculos (el color indica su función propuesta) y el peso del borde significa la importancia de la correlación (una línea gruesa representa una fuerte correlación del gen TF). Los genes mostrados como MICK MADS también están anotados como SHP en algunos estudios.

Las proteínas asociadas al mucílago de las semillas representan componentes esenciales para su estructura. Por lo tanto, se llevó a cabo un análisis proteómico para identificar proteínas en el mucílago de la semilla de S. hispanica. El mucílago se extrajo de las semillas de chía embebidas, se digirió con tripsina y se analizó mediante cromatografía líquida acoplada a espectrometría de masas (LC-MS). El análisis de los péptidos identificados por LC-MS permitió la identificación de 95 proteínas en la muestra de mucílago de chía. Estas proteínas se anotaron funcionalmente utilizando la descripción homóloga de PANZER, InterPro y A. thaliana para generar una clasificación según su familia de proteínas y actividad biológica (Datos complementarios S1). También identificamos 11 glicoproteínas utilizando el software Byonic que también determinó los glicanos unidos a las proteínas (Tabla complementaria S12). Las glicoproteínas identificadas en el mucílago de chía participan en diferentes funciones, entre ellas al menos 3 de las denominadas proteínas dirigentes (DIR), implicadas en el metabolismo secundario. El análisis de expresión indica que los genes que codifican proteínas clasificadas en el metabolismo de carbohidratos y lípidos se expresan principalmente 7 DAF, lo que se correlaciona con la expresión máxima de los genes relacionados con el mucílago previamente identificados (Figura complementaria S14), mientras que las proteínas del mucílago relacionadas con el estrés abiótico, como LEA se expresan principalmente al final del desarrollo de la semilla de chía. Finalmente, para eliminar posibles contaminantes en el proteoma del mucílago de chía, se filtraron las proteínas con una abundancia relativa <0,1% (Tabla complementaria S13). Este análisis dio como resultado un conjunto de alta confianza de 37 proteínas en el mucílago de la semilla de chía, representadas principalmente por proteínas de almacenamiento de semillas, proteínas relacionadas con el metabolismo de los lípidos, proteínas abundantes en la embriogénesis tardía (LEA) y algunas relacionadas con el metabolismo secundario (Tabla 1).

Recientemente, ha habido un mayor interés en desarrollar la chía como cultivo principal para el consumo humano y como fuente de compuestos bioactivos. La producción mundial de semillas de chía ha aumentado en las últimas décadas36, y algunos estudios predicen que el mercado mundial de chía seguirá creciendo en los próximos años37. Sin embargo, todavía es necesario mejorar la información y los recursos para su mejora genética. Este estudio proporciona recursos genómicos críticos para comprender la base genética de rasgos relevantes relacionados con las semillas en S. hispanica. Se generó una referencia del genoma de S. hispanica de alta calidad mediante secuenciación ONT e Illumina y andamiaje a nivel cromosómico con datos Hi-C. La referencia final del genoma muestra una alta contigüidad, con más de la mitad del ensamblaje en solo tres andamios (pseudocromosomas) y una métrica N50 de 61,89 Mb (Tabla complementaria S3). En comparación con los genomas de S. hispanica previamente informados secuenciados con PacBio16, el ensamblaje generado en este estudio tiene una mejora significativa en la captura de regiones ricas en repeticiones, como los centrómeros (Fig. 1a; Fig. Suplementaria S9) y la identificación de repeticiones teloméricas para algunos cromosomas (Figura complementaria S4). Las regiones altamente repetitivas son difíciles de reconstruir y el ensamblaje del genoma mediante la secuenciación PacBio podría fallar en grandes regiones repetitivas38. La reconstrucción e identificación exitosas de regiones centroméricas en nuestro genoma de chía indican que el uso de lecturas ultralargas de ONT nos permitió cubrir regiones genómicas con una alta proporción de repeticiones. Por ejemplo, las más de 600 repeticiones presentes en la región centromérica de chr5 están mal representadas en el mismo cromosoma del ensamblaje Chia PacBio informado anteriormente. Curiosamente, el centrómero de chr5 exhibe una gran disposición en tándem donde la mayoría de las repeticiones centroméricas están una al lado de la otra, separadas por solo dos bases.

En el presente estudio se obtuvo una anotación mejorada del genoma de S. hispanica con la predicción de 34.748 genes codificadores de proteínas (en comparación con 31.069 genes reportados en la variedad australiana16) y un conjunto casi completo de ortólogos de embriófitos conservados (97% de BUSCO completos en comparación con al 93,2% del conjunto PacBio (Figura complementaria S7). La comparación de los genomas de la variedad de chía mexicana con el de la variedad australiana16 indicó una alta concordancia en algunas características del genoma de S. hispanica. Ambos estudios determinaron un contenido de GC en torno al 36,6%, una proporción similar de secuencias repetitivas con los elementos LTR Gypsy y Copia como los más abundantes. Sin embargo, el tamaño estimado del genoma fue ligeramente mayor para la variedad mexicana (358,3 Mb) que para la australiana (354,5 Mb). La alineación del genoma indicó una alta colinealidad entre los genomas de chía mexicano y australiano (Figura complementaria S5); sin embargo, se ubicó un fragmento de 4,6 Mb en diferentes cromosomas en estos dos conjuntos (Figura complementaria S5). Nuestros análisis demostraron que este fragmento genómico es parte de chr1 (Figura complementaria S6). Además, un genoma de chía publicado recientemente, que también se encuentra en ensamblaje a nivel de cromosomas, asignó este mismo fragmento genómico a chr1, lo que respalda nuestros resultados39.

La metilación del ADN es una modificación epigenética en la base citosina importante para regular la expresión genética y la estabilidad del genoma en las plantas, influyendo en los procesos de desarrollo de las plantas y las respuestas a factores ambientales40,41. Se han informado metilomas de resolución de base única de varias especies de plantas42,43,44, lo que proporciona información sobre la dinámica de las vías de metilación del ADN42,44, la función molecular y la distribución genómica40,45. Los patrones de metilación de Salvia hispanica muestran proporciones porcentuales globales de ADN como las reportadas previamente para otros metilomas de plantas (Figura complementaria S8), para las cuales el contexto de metilación de ADN más predominante es CG, seguido de CHH y CHG42,43,44. El análisis de la distribución de la metilación del ADN a lo largo de los cuerpos genéticos mostró un comportamiento similar al informado para las angiospermas43,46, donde se detectan niveles bajos de metilación del ADN alrededor de los sitios de inicio/parada de la traducción. Específicamente, la metilación del ADN mostró un aumento significativo en la densidad de metilación en los TE, lo que concuerda con el papel de la metilación del ADN en el silenciamiento de dichos elementos repetitivos47,48. Un análisis más detallado de los patrones de metilación del ADN puede proporcionar información sobre cómo la metilación del ADN regula los cambios en el desarrollo de la chía, la expresión genética y las respuestas al estrés abiótico y biótico. Además, los estudios de metilación global pueden ser esenciales para comprender el metabolismo secundario de la chía, como se informó anteriormente para S. miltiorrhiza, donde la inhibición química de la metilación del ADN utilizando 5-azacitidina mejoró significativamente la acumulación de ácido fenólico al alterar los patrones de metilación del ADN en los promotores de genes, incluido el promotor. del gen RA sintasa49.

La Salvia hispanica es valiosa principalmente por el valor nutricional y las propiedades promotoras de la salud de sus semillas50. Un estudio previo destacó el transcriptoma de semilla único y distinto en comparación con otras etapas de desarrollo en S. hispanica28. De hecho, las semillas de chía tienen un patrón de expresión único en comparación con otros tejidos o etapas de crecimiento (Fig. 2a). La semilla de chía analizada en el presente estudio confirma que los ácidos grasos (AG) son el componente más abundante (26% del área cromatográfica total; Fig. 2b). El contenido de lípidos en las semillas de chía puede oscilar entre el 20% y el 34%, y es particularmente rico en AG poliinsaturados, principalmente ácido α-linolénico6. Nuestro análisis lipidómico mostró que el ácido α-linolénico es uno de los compuestos de semillas más abundantes, al menos 3,5 veces mayor que el ácido linoleico (Tabla complementaria S9). Otros autores informaron concentraciones de ácido α-linolénico de 59,9 a 63,2% y de ácido linoleico de 18,9 a 20,1% para semillas de chía, lo que indica una proporción de 3:1 (ω-3:ω-6)51. Debido a su alto contenido en ácidos grasos ω-3, se han realizado varios estudios para identificar y dilucidar la vía genética involucrada en la biosíntesis de lípidos de chía16,34,39,52.

Las especies del género Salvia se caracterizan por ser fuentes ricas en polifenoles con múltiples aplicaciones terapéuticas53. El análisis del metaboloma de semillas de chía maduras determinó que el 15% del área cromatográfica total corresponde a compuestos polifenólicos (Fig. 2b). El compuesto más abundante identificado en las semillas de S. hispanica fue el ácido rosmarínico (RA), también el dímero de ácido cafeico más abundante reportado en especies de Salvia53 (Tabla complementaria S9). Un informe anterior determinó que la AR tiene concentraciones de hasta 0,92 mg/g en las semillas de chía14. Las principales actividades de la AR incluyen propiedades antioxidantes, antiinflamatorias, astringentes, antimutágenas, antibacterianas y antivirales54. El alto contenido de AR en las semillas de chía podría sugerir un papel de defensa contra patógenos y prevenir la peroxidación lipídica debido a su actividad antioxidante. La síntesis de AR en plantas es compleja, con una vía no lineal que involucra al menos ocho reacciones diferentes29. Un análisis metabólico detallado identificó todos los precursores e intermedios de la vía de la AR en las semillas de chía, excepto la 4-cumaroil-CoA (Fig. 3). Además, realizamos una búsqueda genética exhaustiva para identificar genes candidatos para cada reacción de esta vía (Tabla complementaria S10). Dado que la última parte de la síntesis de RA no se ha dilucidado por completo, se identificaron en el genoma de S. hispanica muchas enzimas que potencialmente realizan los pasos finales de hidroxilación. Por lo tanto, se examinó la mayor expresión de genes con supuesta función enzimática para estas reacciones en semillas en comparación con otros tejidos. En general, identificamos y propusimos un conjunto de 48 genes para la síntesis de RA en semillas de S. hispanica (Fig. 4). El conocimiento de los genes que participan en la vía de la AR tiene un potencial importante para que la bioingeniería futura aumente la producción de AR o sus derivados en cultivos emergentes, como la chía.

El mucílago de la semilla es otro componente valioso de S. hispanica con muchas aplicaciones potenciales. Se utiliza en la industria alimentaria como sustituto de ingredientes en productos horneados, lácteos y cárnicos55. El mucílago de chía exhibe propiedades físicas excepcionales y puede ser adecuado para la preparación de nanocompuestos o la liberación controlada de fármacos56. Además, entre sus potenciales aplicaciones también se encuentra la generación de películas comestibles como sustitutos de los envases sintéticos57. Sin embargo, a pesar de su importancia industrial y sus posibles aplicaciones tecnológicas futuras, aún no se han descrito la composición detallada y los componentes genéticos implicados en la síntesis del mucílago de chía. Este estudio identificó genes supuestamente involucrados en el metabolismo del mucílago de la semilla de S. hispanica y su expresión durante el desarrollo de la semilla. El conocimiento actual sobre los genes que participan en la síntesis, estabilización, secreción y modificación del mucílago de las semillas, y cómo se regulan, se ha descrito en la planta modelo Arabidopsis thaliana58,59. Los resultados del análisis de homología indicaron que los genes relacionados con el mucílago se expandieron en el genoma de S. hispanica, principalmente en la categoría de síntesis de mucílago (Fig. 5a). Este grupo de genes se expandió significativamente en el genoma de la chía en comparación con Arabidopsis (Fig. 1c). Los genes relacionados con el mucílago con un número significativo de copias en el genoma de la chía exhiben diversas funciones, incluido el mantenimiento de la estructura correcta de la capa adherente de mucílago (CSLA2), la contribución a la síntesis de mucílago (CESA2), la participación en la deposición de celulosa en estructuras secundarias de la pared celular ( COBL2) y genes necesarios para sintetizar polisacáridos de pectina de la pared celular (MUM4 y RRT1)60,61,62,63,64. El mucílago ha sido descrito como una pared celular secundaria especializada65. El conocimiento actual indica que el mucílago se acumula en la capa epidérmica más externa de la cubierta de la semilla, llamada células secretoras de mucílago (CMM)59. En Arabidopsis, estas MSC exhiben una producción significativa de material de pared celular siete días después de la antesis (etapa de embrión torpedo)66. Curiosamente, la mayoría de los genes relacionados con el mucílago identificados en el genoma de S. hispanica tienen su máxima expresión en el desarrollo temprano de la semilla, precisamente a los siete DAF (Fig. 5b). Además, varias de las proteínas asociadas al mucílago más abundantes, que podrían representar componentes esenciales para la estructura del mucílago, también exhiben una expresión máxima durante el desarrollo temprano (Figura complementaria S14).

Dado que varios TF de Arabidopsis involucrados en la producción de mucílago de semillas no tenían un homólogo directo en el genoma de S. hispanica (Figura complementaria S13), se llevó a cabo un análisis de red regulatoria para identificar posibles reguladores transcripcionales del mucílago de semillas de chía. Este análisis identificó 16 TF como nodos reguladores importantes para genes relacionados con mucílago en S. hispanica (Fig. 6). Los homólogos de Arabidopsis de cinco de estos 16 supuestos reguladores se describieron previamente como TF que regulan la producción de mucílago de semillas (incluidos los tipos AP2, SHP1, MYB61 y KNAT7)33,59. Los reguladores candidatos adicionales incluyen TF de las familias ARF, bHLH, bZIP, C3H, GRF, NAC, MIKC MADS y MYB. Se ha informado que los miembros de estas familias de TF son componentes esenciales de las vías transcripcionales que controlan la diferenciación de la cubierta de la semilla, la síntesis y la modificación del mucílago58. La mayoría de estos reguladores tienen su expresión máxima en siete DAF (Figura complementaria S15), lo que se correlaciona con la expresión más alta de genes relacionados con el mucílago en las semillas de S. hispanica (Figura 5b). La visualización de los datos de expresión genética de sus homólogos de Arabidopsis (https://bar.utoronto.ca/eplant/) indicó que la mayoría de los reguladores propuestos se expresan principalmente entre las etapas tempranas del corazón y del torpedo durante el desarrollo del embrión. Una caracterización preliminar del desarrollo embrionario de S. hispanica mostró una alta correlación entre las primeras etapas de desarrollo de chía y Arabidopsis (Figura complementaria S16). En conjunto, todos estos hallazgos son consistentes con el conocimiento actual sobre la producción de mucílago en las semillas de la planta modelo Arabidopsis. Comprender la base genética para la producción de mucílago en S. hispanica podría usarse para diseñar bioingeniería de mucílago con características mejoradas para fines industriales o tecnológicos.

Aunque las proteínas están presentes en una proporción mucho menor que los polisacáridos en el mucílago, las proteínas tienen un papel esencial en la dinámica y funcionalidad de las paredes celulares67. El presente estudio identificó 37 proteínas en el mucílago de la semilla de S. hispanica (Tabla 1; Tabla complementaria S13), 12 clasificadas como proteínas de almacenamiento de semillas comprendieron el 67% de la abundancia de proteínas. Informes anteriores indicaron que las globulinas corresponden a la principal fracción proteica identificada en las semillas de chía68; este estudio determinó que también están presentes en el mucílago de las semillas, representado principalmente por 11 S globulinas (Datos complementarios S1). El tipo de proteínas identificadas en el mucílago de chía es similar a los grupos informados anteriormente en el mucílago de la cubierta de la semilla de Arabidopsis69. En comparación con el mucílago de la semilla de Arabidopsis, el mucílago de chía muestra una mayor cantidad de almacenamiento de semillas y proteínas LEA y una cantidad mucho menor de carbohidratos y enzimas antioxidantes. Las proteínas del mucílago de chía que exhiben actividades sobresalientes incluyen proteínas DIR caracterizadas por modular el metabolismo de la pared celular durante el desarrollo y en respuesta a condiciones de estrés abiótico y biótico70,71. Específicamente, las proteínas DIR participan en la biosíntesis de lignanos y lignina. Los lignanos tienen un papel esencial en las respuestas de defensa de las plantas contra patógenos72,73, mientras que la lignina es un componente crucial de los sistemas vasculares de las plantas y para mantener la turgencia y la porosidad de la pared celular74,75. En las plantas, se ha descrito que las proteínas DIR desempeñan un papel en la biosíntesis protectora de neolignanos de la cubierta de la semilla71, el estrés abiótico76,77 y el estrés biótico78,79. Se ha informado que el mucílago de las semillas influye en la germinación de las semillas y el establecimiento de las plántulas80, y las proteínas DIR podrían contribuir a estas funciones propuestas por el mucílago durante el estrés biótico y biótico.

Actualmente, S. hispanica se cultiva principalmente para la producción de semillas, pero sus hojas representan una fuente adicional de diversos metabolitos con propiedades antioxidantes y antimicrobianas81. Se han realizado algunos esfuerzos para estudiar vías relevantes del metabolismo secundario en las hojas de chía, como la biosíntesis de terpenoides82. Sin duda, la información molecular contribuirá al estudio del metabolismo secundario único de la chía y ayudará a establecer esta especie como un cultivo importante en todo el mundo. El genoma, las proteínas, los genes y las vías descritas en este trabajo podrían proporcionar la base para mejorar la producción y la calidad de los compuestos y derivados de la chía.

Se cultivaron plantas de Salvia hispanica de una variedad mexicana (Figura complementaria S1) en una cámara de entrada Conviron programada a 26 °C durante 16 h de luz los primeros 3 meses, luego se cambiaron a 12 h de luz para inducir la floración. Los núcleos de S. hispanica se aislaron según lo descrito por Peterson (1997)83. Brevemente, se recolectaron hojas jóvenes de un solo individuo de S. hispanica (aproximadamente 2 gramos) y se molieron en nitrógeno líquido. Luego, el tejido puesto a tierra se transfirió a un nuevo tubo Falcon en nitrógeno líquido y se almacenó a -80 °C hasta su uso. El aislamiento de los núcleos se llevó a cabo añadiendo 40 ml de tampón de aislamiento de núcleos (NIB) y se incubó durante 10 minutos a 4 °C. El lisado se filtró a través de 3 capas de Miracloth, se recogió en un tubo sobre hielo y se centrifugó durante 10 minutos a 1000 x g a 4 °C para precipitar los núcleos. Luego, el sedimento de núcleos precipitado se resuspendió en Percoll al 70 % en NIB y se centrifugó a 600 x g durante 10 min. El sedimento de núcleos se lavó con NIB y se centrifugó dos veces a 600 x g. El exceso de NIB se eliminó pipeteando y el sedimento de núcleos se usó para el aislamiento de ADN de alto peso molecular (HMW) o se congeló instantáneamente con nitrógeno líquido y se almacenó a -80 °C.

Siguiendo las instrucciones del fabricante, se utilizó una alícuota de 200 µl de sedimento de núcleos para el aislamiento de ADN de HMW utilizando el kit Nanobind Plant Nuclei Big DNA (Circulomics, EE. UU.). La integridad del ADN genómico se evaluó utilizando el sistema Agilent 4200 TapeStation (Agilent Genomics). El ADN de HMW purificado se preparó para la secuenciación de ONT utilizando el kit de secuenciación de ligación SQK-LSK109 siguiendo las instrucciones del fabricante (ONT, Oxford, Reino Unido). Las bibliotecas se cargaron en celdas de flujo R9.4.1 y se secuenciaron utilizando un instrumento MinION Mk1C (ONT, Oxford, Reino Unido). Novogene (Beijing, China) realizó la secuenciación de lectura corta de Illumina en un Illumina NovaSeq 6000 en modo PE150. Para las muestras de Hi-C, el sedimento de núcleos congelados instantáneamente (aproximadamente 20 µl) se descongeló en hielo y se reticuló siguiendo el protocolo descrito en la sección Reticulación: entrada baja de la Guía del usuario del kit Arima-HiC 2.0 para líneas celulares de mamíferos (Arima Genomics). . Luego se eluyó la suspensión de núcleos reticulados en 130 µl de tampón de elución y se fragmentó a un tamaño de fragmento promedio de 550 a 600 pb utilizando un ultrasonido enfocado Covaris E220. Luego, se seleccionó el tamaño del ADN fragmentado para una distribución de tamaño >400 pb usando perlas magnéticas (Magbind Total Pure NGS, Omega BIO-TEK) y se usó como entrada para preparar el ADN ligado proximalmente como se indica en el manual del protocolo Arima-HiC 2.0. Las bibliotecas de andamios Hi-C se prepararon utilizando el kit Swift Accel NGS 2 S Plus siguiendo las instrucciones del fabricante.

Las lecturas de Illumina se recortaron con calidad (para adaptadores, bases de baja calidad) utilizando TrimGalore (v0.6.6; https://github.com/FelixKrueger/TrimGalore). Se utilizó Jellyfish84 (v2.3.0) para la distribución de frecuencia de k-mer (21-mer) basada en las lecturas de Illumina recortadas con calidad. El histograma de salida se utilizó para estimar el tamaño del genoma con el paquete R findGSE85 (v1.94). Las señales ONT sin procesar (archivos fast5) se llamaron mediante Guppy (v5.0.16) y los adaptadores de secuenciación se recortaron utilizando Porechop (v0.2.4; https://github.com/rrwick/Porechop). Las lecturas de ONT procesadas se corrigieron y ensamblaron utilizando el software NECAT17 (v0.0.1). El ensamblaje de salida se pulió utilizando seis iteraciones de Pilon18 (v1.24) con datos de Illumina. Los contigs primarios se identificaron utilizando Purge Haplotigs19 (v1.1.2). Los contigs se estructuraron utilizando tuberías Juicer20 y 3D-DNA21 con datos Hi-C. Los andamios se seleccionaron manualmente para crear un ensamblaje genómico con andamios de longitud cromosómica. En cada paso de este proceso, la calidad de los ensamblajes se evaluó utilizando BUSCO22 (v5.4.3) con conjuntos de datos de embriofitos y eudicots (odb10) y la tasa de alineación de datos de Illumina utilizando Bowtie286. Las repeticiones centroméricas en tándem se identificaron utilizando Tandem Repeats Finder23 (v4.09.1) y nhmmer (v3.3.2; hmmer.org). Antes de definir sus ubicaciones, las regiones centroméricas candidatas se compararon manualmente con la metilación (recuentos de 5 mC), la densidad genética y el contenido repetitivo de ADN. Las repeticiones teloméricas se identificaron utilizando Telomere Identification toolKit (v0.2.0; https://github.com/tolkit/telomeric-identifier) ​​buscando la secuencia telomérica típica de la planta ("TTTAGGG").

Se utilizó Minimap287 (v2.24) para alinear la referencia del genoma generada en este estudio con el genoma de chía informado anteriormente16. Se utilizó la herramienta en línea D-Genies88 para visualizar las alineaciones de todo el genoma. Se identificó un fragmento de alrededor de 4,6 Mb como la principal diferencia entre estos ensamblajes. Se llevaron a cabo análisis detallados para determinar la ubicación genómica correcta de esta región. Primero, esta región se dividió y se consideró como otro contig para realizar análisis de datos Hi-C utilizando dos conjuntos de datos independientes (datos Hi-C generados en este estudio y datos disponibles SRA Accession: DRX325318). Los mapas de calor de contacto Hi-C se generaron y visualizaron utilizando Juicebox20 (v1.11.08). Finalmente, las frecuencias de contacto y el número de alineamientos emparejados Hi-C determinaron la posición genómica más probable de este fragmento.

La llamada de metilación utilizando datos ONT se realizó utilizando la tubería de la planta DeepSignal89. Las lecturas ONT se convirtieron en archivos fast5 únicos mediante el comando multi_to_single_fast5 incluido en el paquete ont_fast5_api. Luego, las lecturas de nanoporos y los archivos fast5 se preprocesaron utilizando los comandos tombo preprocess y tombo resquiggle. A continuación, se utilizó el comando deepsignal_plant call_mods para realizar la llamada de metilación del ADN ejecutando el modelo 5mC entrenado con lecturas 1D de Arabidopsis thaliana y Oryza sativa R9.4 (model.dp2.CNN.arabnrice21_120m_R9.4plus_tem.bn13_sn16.both_bilstm.epoch6.ckpt). Se obtuvieron posiciones de 5 mC de alta calidad de 4 experimentos de nanoporos diferentes después de la canalización de la planta DeepSignal, y solo se conservaron aquellas posiciones de 5 mC presentes en al menos 2 réplicas para análisis de datos adicionales.

El ensamblaje del genoma se anotó mediante tres rondas de MAKER-P25,26 (v3.01.03). La primera ronda utilizó 1) como transcripciones de evidencia EST obtenidas al alinear un total de 66 bibliotecas de RNA-seq disponibles28,34,52,82 usando HISAT290 (v2.2.1) y reconstruyendo las transcripciones a partir del archivo de alineación usando StringTie91 (v2.2.1); 2) como evidencia de proteínas, el conjunto de datos OrthoDB obd10 de plantas disponible en la página web github de ProtHint (https://github.com/gatech-genemark/ProtHint), filtrado para mantener solo las especies pertenecientes al orden Lamiales; 3) como archivo de repeticiones, las secuencias de repetición de novo obtenidas usando RepeatModeler (v2.0.3) con RepeatMasker (http://www.repeatmasker.org; v4.1.2-p1), Dfam92 (v3.6) y un LTR_retriever93 ( v2.9.0) ejecución de los resultados de LTR_Finder_parallel94,95 y ltr_harvest96. La segunda ronda utilizó como entrada el archivo maker gff3 de la primera ronda, un archivo SNAP hmm obtenido de los modelos genéticos de la ronda 1 y los modelos genéticos Augustus97 de una ejecución BUSCO98 siguiendo el método de Daren Card (https://darencard.net/blog/2017 -05-16-maker-genome-annotation/; sección Augustus) con el conjunto de datos eudicots_odb10. La tercera ronda se llevó a cabo como la segunda ronda, utilizando los archivos de salida de la ronda 2 como entradas. El archivo gff3 de la ronda 3 se usó para recrear las secuencias CDS usando un script Perl personalizado, que se tradujeron a secuencias de proteínas usando el programa transeq de la suite EMBOSS (v6.6.0). La integridad de la anotación del genoma se evaluó utilizando BUSCO22 con conjuntos de datos de embriofitos y eudicots (odb10).

Las anotaciones de Gene Ontology se asignaron utilizando una versión simplificada del proceso MAIZE-gamer99. Brevemente, se asignaron anotaciones como las anotaciones GO de los mejores resultados recíprocos de BLASTP versus las proteínas Araport11 y UniProt Swiss-Prot de nueve especies de plantas (Glycine max, Oryza sativa subsp. japonica, Populus trichocarpa, Solanum lycopersicum, Sorghum bicolor, Vitis vinifera, Brachypodium distachyon, Physcomitrium patens y Chlamydomonas reinhardtii), las anotaciones GO de un análisis InterProScan100 (v5.57-90.0) y las anotaciones GO del servidor web de anotaciones funcionales PANNZER2101 con un valor PPV de al menos 0,5. Todas estas anotaciones GO se fusionaron en un archivo gaf no redundante.

Se molieron semillas de chía (1 g de semillas secas) en nitrógeno líquido y se liofilizaron durante la noche. Posteriormente, se extrajeron 300 mg de polvo de semilla de chía con 3 ml de una mezcla de metanol:cloroformo (1:1 v/v), se sonicaron durante 5 min y se centrifugaron a 4000 rpm durante 10 min. Tanto la fase sobrenadante como la insoluble se recogieron para seguir procesando. Se secó una alícuota de 2 ml de sobrenadante en vacío rápido y posteriormente se reconstituyó en 200 µl de etanol al 95 % grado HPLC. La fase insoluble se secó con flujo de nitrógeno durante la noche y luego se volvió a extraer con 1 ml de una mezcla de agua:metanol (60:40 v/v). Este extracto polar se filtró con filtros de celulosa reconstituida de 0,2 µm y se inyectó en un sistema de cromatografía Vanquish Flex UHPLC acoplado a un detector de espectrometría de masas Exploris 240 (Thermo Scientific).

El extracto lipídico de semillas de chía se analizó con una columna C18 de 150 × 2,1 mm (Thermo Scientific) utilizando un método de gradiente de agua con ácido fórmico al 0,1% (fase A) y alcohol isopropílico con formiato de amonio 2 mM (fase B). Las condiciones cromatográficas fueron las siguientes: se comenzó con 10% de B de 0 a 3 min, luego se aumentó la concentración de B al 50% de 3 a 7 min y más de 50 a 100% de B de 7 a 20 min. El 100% B se mantuvo durante 6 min, luego se equilibró al 10% B de 26 a 30 min. La temperatura de la columna fue de 50 °C y el flujo se mantuvo constante a 200 µl/min. La detección se logró con modos de ionización positiva y negativa a 4500 V y 1200 V, respectivamente. Se adquirió MS/MS (DDA) dependiente de datos para los 20 picos más intensos en cada escaneo completo y se aplicó exclusión dinámica para 10 escaneos sucesivos. El análisis de los datos se realizó utilizando el software LipidSearch 5.0 (Thermo Scientific) con la base de datos en línea LipidMaps102.

El extracto de metabolito polar se inyectó en una columna C18 de fase inversa y se separó utilizando un método de gradiente de agua al 0,1% de ácido fórmico (A) y metanol al 0,1% de ácido fórmico (B). El flujo inicial se ajustó a 200 µl/min, 5% B durante 4 min, luego se aumentó a 100% B en 13 min. Esta condición se mantuvo durante 4 min y luego se volvió a ajustar a 5% B para reequilibrar durante 4 min. Se utilizaron ejecuciones independientes para los modos de detección positiva y negativa con MS/MS DDA. Los archivos sin procesar se cargaron en el software Compound Discoverer 3.3 (Thermo Scientific) y se analizaron mediante un proceso de metabolómica. Se unieron las tablas de resultados de los modos de ionización positiva y negativa y se investigaron más a fondo para eliminar identificaciones duplicadas. La identificación de metabolitos se realizó utilizando las bases de datos en línea mzCloud, KEGG y BioCyc y se curó manualmente.

La extracción de mucílago se realizó según Tsai et al.69. Brevemente, las semillas (2 g de semillas secas; 3 réplicas) se remojaron en agua 1:10 p/v y se colocaron en un agitador orbital durante 1 h. Luego se transfirió a nitrógeno líquido y se liofilizó durante 48 h. El mucílago se separó de la semilla con una pequeña malla y se recogió para cuantificar su contenido de proteína. Para el análisis proteómico, se mezclaron 300 mg de mucílago de chía seco con 30 ml de tampón de bicarbonato de amonio (ABC) 50 mM. Luego, se colocó una alícuota de 100 µl del mucílago resuspendido en un microtubo de filtro con un corte de 100 kDa y se incubó a 90 °C en un baño de agua durante 15 minutos para la desnaturalización de las proteínas. La digestión de proteínas se completó en la superficie del filtro mencionado anteriormente. Inicialmente, se añadió ditiotreitol (DTT) para reducir los enlaces disulfuro de la proteína mediante incubación a 60 °C durante 45 min. Luego, los residuos de cisteína de las proteínas desnaturalizadas y reducidas se alquilaron con yodoacetamida (IAA) a 37 °C durante 60 min. La muestra se digirió con enzima tripsina según las instrucciones del fabricante en una proporción de 1:25 p/p durante 18 h a 37 °C. Finalmente, los digestos trípticos se separaron del mucílago mediante centrifugación a 10.000 rpm durante 10 min. Los digestos trípticos recuperados se secaron en un centrífugo y se desalinizaron utilizando puntas superiores C18. Las muestras se resuspendieron en 20 µl de fase móvil (98 % agua, 2 % acetonitrilo, 0,1 % ácido fórmico). Luego, las muestras se analizaron en un nanoLC Ultimate 3000 con una columna de cromatografía PepMap RSLC C18 (3 µm, 100 Å, 75 µm x 15 cm). Las fases móviles utilizadas fueron A: agua 0,1% ácido fórmico (FA) y B: acetonitrilo:agua (80:20 v/v) 0,1% FA. El método comenzó con 2% B por hasta 5 min y luego aumentó a 25% B en 105 min, 25-40% de 105 a 125 min, 40-95% B de 125-126 min y nuevamente a 2% B a 128 min. min durante 6 min. La detección se llevó a cabo en un Orbitrap Exploris 240 (Thermo Scientific, EE. UU.) en modo positivo configurado en 120.000 en la resolución del orbitrap. DDA MS/MS se configuró en un umbral de intensidad de 5 × 103 y estados de carga de 2 a 8. Los archivos de datos sin procesar se cargaron y procesaron con el software Proteome Discoverer 2.5 y Byonic. La identificación de proteínas se realizó utilizando las proteínas predichas en el genoma de S. hispanica, utilizando como filtros FDR ≤ 0,01 y al menos 3 péptidos únicos en la secuencia. Utilizamos el software Byonic para confirmar la identidad de las glicoproteínas. Búsqueda biónica de glicosilaciones a lo largo del esqueleto proteico peptídico, permitiendo una identificación precisa de los glicanos unidos a las proteínas.

Los datos de RNA-seq disponibles públicamente durante el ciclo de vida de S. hispanica, incluidos diferentes tejidos y etapas de crecimiento28, se recuperaron del EMBL-EBI ArrayExpress (número de experimento E-MTAB-5515), y un conjunto de datos adicional de RNA-seq de S. hispanica durante el desarrollo de semillas34 se recuperó de la base de datos NCBI SRA (número de acceso PRJNA196477). Las muestras durante el ciclo de vida incluyeron: cotiledón y brote a los 3 días (3D); primordios foliares (LP) y disparar a 12D; 1.ª y 2.ª hojas (P1P2), 3.ª y 4.ª hojas (P3P4), 5.ª, 6.ª y 7.ª hojas (P5P6P7) y entrenudo a 69D; inflorescencia en racimo de la mitad superior o inferior en 158D; flores en 159D; flores en 164D; y semillas secas. Las muestras durante el desarrollo de las semillas incluyeron: semillas en desarrollo a los 3, 7, 14, 21 y 28 días después de la floración. En la Tabla complementaria S8 se proporciona una descripción detallada de cada tipo de tejido y etapas de crecimiento incluidas en estos transcriptomas. Las secuencias sin procesar de RNA-seq se recortaron en calidad (para adaptadores, bases de baja calidad) utilizando TrimGalore (v0.6.6). El análisis de la expresión génica durante el ciclo de vida de la chía se cuantificó utilizando kalisto103 (v0.44), normalizado (CPM). El valor CPM promedio entre réplicas se transformó en puntuación Z antes del análisis de componentes principales (paquete plotMDS limma104). Se utilizó el Ensemble Enzyme Prediction Pipeline para identificar enzimas putativas y clasificarlas según sus funciones catalíticas previstas105. Los genes candidatos para la biosíntesis de RA se identificaron utilizando números de la Comisión de Enzimas informados previamente para su síntesis en plantas (2.6.1.5, 1.1.1.237, 4.3.1.5, 1.14.13.11, 6.2.1.12, 2.3.1.140)29. Se utilizaron homólogos de S. miltiorrhiza y M. officinalis ácido rosmarínico sintasa (GenBank: FJ906696.1 y FR670523.1, respectivamente) para la reacción EC 2.3.1.14031,32. La información para convertir 4-cumaroil-4'-hidroxifenillactato en (R)-rosmarinato se tomó de MetaCyc (EC 1.14.14.-). Los niveles de expresión de genes candidatos de AR durante el ciclo de vida se cuantificaron utilizando kalisto103 (v0.44) y se normalizaron utilizando el paquete DESeq2106. La expresión media entre réplicas se normalizó con la puntuación Z y se utilizó para analizar diferentes tejidos y etapas durante el ciclo de vida. Se utilizaron genes previamente informados para el metabolismo del mucílago de la semilla en A. thaliana33,59 para identificar genes homólogos en el genoma de S. hispanica. Los genes relacionados con el mucílago se identificaron utilizando BLASTP con el conjunto de genes de A. thaliana como consulta. Para evitar la identificación errónea de genes relacionados con el mucílago, los criterios para seleccionar homólogos en S. hispanica incluyeron: puntuación de bits ≥ 80, alineación de la longitud total de la secuencia de consulta ≥ 80% e identidad entre las secuencias de consulta y sujeto ≥ 50%. Los genes candidatos se clasificaron manualmente según su mejor resultado de acuerdo con la función propuesta en A. thaliana. Los niveles de expresión de genes relacionados con el mucílago se cuantificaron utilizando kalisto103 (v0.44), y los valores de log10 (TPM) se normalizaron con la puntuación Z para analizar la expresión durante el desarrollo de la semilla. Se utilizó el servidor web PlantTFDB (v5.0; http://planttfdb.gao-lab.org/) para identificar TF en genes de S. hispanica107. El paquete RegEnrich35 (v1.4.0) se utilizó para construir redes reguladoras de genes con GRN (es decir, algoritmo de bosque aleatorio) como método de inferencia y la lista de TF predichos como reguladores potenciales. El objeto de red de salida se ordenó por peso de borde para seleccionar nodos regulatorios importantes y se filtró para retener el 5% superior con las correlaciones más altas. La red resultante se analizó manualmente para identificar todas las interacciones genéticas que involucran genes relacionados con el mucílago y, finalmente, los reguladores candidatos se determinaron según el alto grado de nodo.

Se recolectaron hojas de un solo individuo de S. hispanica para realizar la secuenciación de Nanopore, Illumina y Hi-C. Para los análisis metabólicos, lipidómicos y proteómicos de las semillas se utilizaron tres réplicas biológicas. La significación estadística se calculó utilizando métodos integrados de software. Un valor de p <0,05 se consideró estadísticamente significativo para los análisis de enriquecimiento de ontología genética.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Todos los datos que respaldan los resultados de este estudio se incluyen en el manuscrito y sus archivos complementarios. Los datos de secuenciación del genoma completo y el ensamblaje del genoma están disponibles en NCBI bajo BioProject PRJNA978134 y en CoGe con ID de genoma 66177. Se puede acceder a los modelos genéticos y anotaciones del genoma generados en este estudio desde www.depts.ttu.edu/igcast/Staff/ Disponibilidad_datos.php. Los datos proteómicos del mucílago de la semilla se depositaron en MassIVE y ProteomeXchange con los identificadores MSV000092476 y PXD043875, respectivamente. Los detalles de acceso a los datos de RNA-seq disponibles públicamente utilizados en el estudio se proporcionan en la sección Métodos. Todos los demás datos relevantes están disponibles previa solicitud a los autores correspondientes.

Harley, RM y cols. Labiatas. en Plantas con Flor · Dicotiledóneas. Las familias y géneros de plantas vasculares (ed. Kadereit, JW) vol. 7 167–275 (2004).

Kokkini, S., Karousou, R. y Hanlidou, E. HIERBAS | Hierbas de las Labiatas. Enciclopedia de Ciencias de los Alimentos y Nutrición 3082–3090 (2003).

Hao, DC, Gu, X.-J. & Xiao, PG Investigación fitoquímica y biológica de los recursos medicinales de Salvia. en Plantas Medicinales 587–639 (Elsevier, 2015). https://doi.org/10.1016/b978-0-08-100085-4.00014-1.

Valdivia López, M. Á. & Tecante, A. Chia (Salvia hispanica): Una revisión de las semillas nativas mexicanas y sus propiedades nutricionales y funcionales. en Avances en la investigación sobre alimentación y nutrición vol. 75 53–75 (Academic Press Inc., 2015).

Kulczyński, B., Kobus-Cisowska, J., Taczanowski, M., Kmiecik, D. & Gramza-Michałowska, A. La composición química y el valor nutricional de las semillas de chía: estado actual del conocimiento. Nutrientes 11, (2019).

Melo, D., Machado, TB & Oliveira, MBPP Semillas de chía: un grano antiguo que es tendencia en las dietas humanas modernas. Función alimentaria. 10, 3068–3089 (2019).

Artículo CAS PubMed Google Scholar

de Falco, B., Amato, M. & Lanzotti, V. Productos de semillas de chía: una descripción general. Fitoquímica. Rev. 16, 745–760 (2017).

Artículo de Google Scholar

Peiretti, PG & Gai, F. Ácidos grasos y calidad nutritiva de las semillas y plantas de chía (Salvia hispanica L.) durante el crecimiento. Animación. Alimentar ciencia. Tecnología. 148, 267–275 (2009).

Artículo CAS Google Scholar

Timilsena, YP, Adhikari, R., Kasapis, S. y Adhikari, B. Características moleculares y funcionales de la goma purificada de semillas de chía australianas. Carbohidrato. Polimero. 136, 128-136 (2016).

Artículo CAS PubMed Google Scholar

Kučka, M., Ražná, K., Harenčár, Ľ. & Kolarovičová, T. Mucílago de semillas de plantas: gran potencial para la materia pegajosa. Nutracéuticos 2022 2, 253–269 (2022).

Google Académico

da Silveira Ramos, IF et al. Nuevas propiedades del mucílago de la semilla de chía (Salvia hispanica L.) y potencial aplicación en productos cosméticos y farmacéuticos. Productos de cultivos industriales 171, (2021).

Reyes-Caudillo, E., Tecante, A. & Valdivia-López, MA Contenido de fibra dietética y actividad antioxidante de los compuestos fenólicos presentes en las semillas de chía mexicana (Salvia hispanica L.). Química de los alimentos. 107, 656–663 (2008).

Artículo CAS Google Scholar

Oliveira-Alves, SC et al. Caracterización de compuestos fenólicos en semillas, harina y aceite de fibra de chía (Salvia hispanica L.). Química de los alimentos. 232, 295–305 (2017).

Artículo CAS PubMed Google Scholar

Martínez-Cruz, O. & Paredes-López, O. Perfil fitoquímico y potencial nutracéutico de semillas de chía (Salvia hispanica L.) mediante cromatografía líquida de ultra alta resolución. J. Cromatogr. A 1346, 43–48 (2014).

Artículo PubMed Google Scholar

Marchev, AS et al. Ácido rosmarínico: del banco a aplicaciones valiosas en la industria alimentaria. Tendencias Ciencia de los alimentos. Tecnología. 117, 182-193 (2021).

Artículo CAS Google Scholar

Wang, L. y col. Un ensamblaje del genoma de la chía a nivel de cromosomas proporciona información sobre el alto contenido de omega-3 y la variación del color del pelaje de sus semillas. Planta Comun. 3, 100326 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Chen, Y. et al. El ensamblaje eficiente de lecturas de nanoporos mediante una corrección de errores intacta y de alta precisión. Nat. Comunitario. 12, 1-10 (2021).

Google Académico

Walker, BJ y cols. Pilon: una herramienta integrada para la detección integral de variantes microbianas y la mejora del ensamblaje del genoma. PLoS One 9, 112963 (2014).

Artículo de Google Scholar

Roach, MJ, Schmidt, SA y Borneman, AR Purge Haplotigs: reasignación de contig alélico para ensamblajes de genoma diploide de tercera generación. BMC Bioinforma. 19, 1-10 (2018).

Artículo de Google Scholar

Durand, NC y cols. Juicer proporciona un sistema de un solo clic para analizar experimentos Hi-C con resolución de bucle. Sistema celular. 3, 95 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Dudchenko, O. y col. El ensamblaje de novo del genoma de Aedes aegypti utilizando Hi-C produce andamios de longitud cromosómica. Ciencia (1979) 356, 92–95 (2017).

CAS Google Académico

Simão, FA, Waterhouse, RM, Ioannidis, P., Kriventseva, EV y Zdobnov, EM BUSCO: evaluación de la integridad del ensamblaje y la anotación del genoma con ortólogos de copia única. Bioinformática 31, 3210–3212 (2015).

Artículo PubMed Google Scholar

Benson, G. Tandem repite buscador: un programa para analizar secuencias de ADN. Ácidos nucleicos res. 27, 573–580 (1999).

Artículo CAS PubMed PubMed Central Google Scholar

Peska, V. & García, S. Origen, diversidad y evolución de secuencias de telómeros en plantas. Ciencia vegetal frontal. 11, 117 (2020).

Artículo PubMed PubMed Central Google Scholar

Cantarel, BL et al. FABRICANTE: Un canal de anotaciones fácil de usar diseñado para genomas de organismos modelo emergentes. Genoma Res. 18, 188-196 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Holt, C. y Yandell, M. MAKER2: Una herramienta de gestión de bases de datos genómicas y de anotaciones para proyectos genómicos de segunda generación. BMC Bioinforma. 12, 1-14 (2011).

Artículo de Google Scholar

Ni, P. y col. DeepSignal: detección del estado de metilación del ADN a partir de lecturas de secuenciación de Nanopore mediante aprendizaje profundo. Bioinformática 35, 4586–4595 (2019).

Artículo CAS PubMed Google Scholar

Gupta, P. y col. El atlas de expresión genética de chía (Salvia hispanica) aclara los cambios dinámicos espacio-temporales asociados con el crecimiento y desarrollo de las plantas. Ciencia vegetal frontal. 0, 1347 (2021).

Google Académico

Trócsányi, E., György, Z. y Zámboriné-Németh, É. Nuevos conocimientos sobre la biosíntesis del ácido rosmarínico basados ​​en estudios moleculares. actual. Biol vegetal. 23, 100162 (2020).

Artículo de Google Scholar

Schläpfer, P. y col. Predicción de todo el genoma de enzimas metabólicas, vías y grupos de genes en plantas. Fisiol vegetal. 173, 2041-2059 (2017).

Artículo PubMed PubMed Central Google Scholar

Di, P. y col. El trazador 13C revela la biosíntesis de ácidos fenólicos en cultivos de raíces peludas de salvia miltiorrhiza. Química ACS. Biol. 8, 1537-1548 (2013).

Artículo CAS PubMed Google Scholar

Weitzel, C. & Petersen, M. Clonación y caracterización de la ácido rosmarínico sintasa de Melissa officinalis L. Phytochemistry 72, 572–578 (2011).

Artículo CAS PubMed Google Scholar

Parra-Rojas, JP et al. Nuevos pasos en la biosíntesis de mucílago revelados por el análisis del transcriptoma del mutante transportador 2 UDP-ramnosa/UDP-galactosa. J. Exp. Bot. 70, 5071 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Sreedhar, RV, Priya, K., Sunny, DR, Ram, R. y Malathi, S. Exploración de la vía biosintética del triacilglicerol en el desarrollo de semillas de chía (Salvia hispanica L.): un enfoque transcriptómico. PLoS One 10, e0123580 (2015).

Artículo de Google Scholar

Tao, W., Radstake, TRDJ y Pandit, A. El análisis de enriquecimiento del regulador genético RegEnrich revela un papel clave de la familia del factor de transcripción ETS en la señalización del interferón. Comunitario. Biol. 5, 1-12 (2022).

Artículo de Google Scholar

Orona-Tamayo, D., Valverde, ME & Paredes-Lopez, O. Chia-La nueva semilla de oro del siglo XXI: propiedades nutracéuticas y usos tecnológicos. en Fuentes de proteínas sostenibles 265–281 (Elsevier Inc., 2017). https://doi.org/10.1016/B978-0-12-802778-3.00017-2

Terán-Yepez, E., Santos-Roldán, L., Palacios-Florencio, B. & Berbel-Pineda, JM El proceso de selección del mercado exterior como herramienta para la expansión internacional: un estudio de caso para las exportaciones de semillas de chía ecuatorianas a la Unión Europea. Acad. Sujetadores. Ciencia. 92, e20190513 (2020).

Artículo de Google Scholar

Lang, D. y col. Comparación de las dos tecnologías de secuenciación actualizadas para el ensamblaje del genoma: lecturas de alta fidelidad del sistema Sequel II de Pacific Biosciences y lecturas ultralargas de Oxford Nanopore. Gigaciencia 9, 1–7 (2020).

Artículo CAS Google Scholar

Li, L. y col. Un ensamblaje casi completo del genoma de la chía ayuda a identificar las desaturasas de ácidos grasos clave en las semillas en desarrollo. Frente. Ciencia vegetal. 14, 984 (2023).

Google Académico

Zhong, S. y col. Los metilomas de resolución de base única del desarrollo del fruto del tomate revelan modificaciones del epigenoma asociadas con la maduración. Nat. Biotecnología. 31, 154-159 (2013).

Artículo CAS PubMed Google Scholar

Yong-Villalobos, L. et al. El análisis de metiloma revela un papel importante de los cambios epigenéticos en la regulación de la respuesta de Arabidopsis a la falta de fosfato. Proc. Acad. Nacional. Ciencia. 112, E7293–E7302 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Zhang, X. y col. Mapeo de alta resolución de todo el genoma y análisis funcional de la metilación del ADN en Arabidopsis. Celda 126, 1189-1201 (2006).

Artículo CAS PubMed Google Scholar

Niederhuth, CE y cols. Variación natural generalizada de la metilación del ADN dentro de las angiospermas. Genoma Biol. 17, (2016).

Gent, JI et al. Islas CHH: metilación del ADN de novo en la regulación de la cromatina casi genética en el maíz. Genoma Res. 23, 628 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Seymour, DK, Koenig, D., Hagmann, J., Becker, C. y Weigel, D. La evolución de los patrones de metilación del ADN en Brassicaceae está impulsada por diferencias en la organización del genoma. PLoS Genet 10, e1004785 (2014).

Artículo PubMed PubMed Central Google Scholar

Muyle, AM, Seymour, DK, Lv, Y., Huettel, B. & Gaut, BS Metilación del cuerpo genético en plantas: mecanismos, funciones e implicaciones importantes para comprender los procesos evolutivos. Genoma Biol. Evolución. 14, (2022).

Hollister, JD & Gaut, BS Silenciamiento epigenético de elementos transponibles: un equilibrio entre transposición reducida y efectos nocivos sobre la expresión de genes vecinos. Genoma Res 19, 1419-1428 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, Z. y Baulcombe, DC Edad del transposón y metilación no CG. Nat Comuna 11, (2020).

Yang, D. y col. Metilación del ADN: un nuevo regulador de la biosíntesis de ácidos fenólicos en Salvia miltiorrhiza. Prod. de cultivos industriales. 124, 402–411 (2018).

Artículo CAS Google Scholar

Prathyusha, P., Suneetha, J., Naga, M., Srujana, S. y Kumari, A. Semillas de chía para la seguridad nutricional. J. Farmacogn. Fitoquímica 8, 2702–2707 (2019).

CAS Google Académico

Propiedades físicas, caracterización química y composición de ácidos grasos de las semillas de chía mexicana (Salvia hispanica L.). Int J. Ciencia de los alimentos. Tecnología. Rev. 49, 571–577 (2014).

Artículo CAS Google Scholar

Peláez, P. et al. Análisis comparativo del transcriptoma de semillas cultivadas y silvestres de Salvia hispanica (chía). Ciencia. Rep. 9, 1-11 (2019).

Artículo de Google Scholar

Lu, Y. & Foo, LY Polifenoles de Salvia: una revisión. Fitoquímica 59, 117-140 (2002).

Artículo CAS PubMed Google Scholar

Petersen, M. & Simmonds, MSJ Ácido rosmarínico. Fitoquímica 62, 121-125 (2003).

Artículo CAS PubMed Google Scholar

Chiang, JH y cols. Aplicación del mucílago de chía (Salvia hispanica) como ingrediente sustituto en alimentos. Tendencias Ciencia de los alimentos. Tecnología. 115, 105-116 (2021).

Artículo CAS Google Scholar

Bochicchio, R. et al. Producciones agrícolas innovadoras para una alimentación saludable: El caso de la Chía (Salvia hispanica L.). en La sostenibilidad de los sistemas agroalimentarios y de recursos naturales en la cuenca mediterránea 29–45 (Springer International Publishing, 2015). https://doi.org/10.1007/978-3-319-16357-4_3/FIGURES/2.

Hrnčič, MK, Ivanovski, M., Cör, D. y Knez, Ž. Semillas de chía (Salvia hispánica L.): descripción general: perfil fitoquímico, métodos de aislamiento y aplicación. Moléculas 25, 11 (2019).

Artículo de Google Scholar

Liu, Y. et al. Mucílagos de la cubierta de la semilla: propiedades estructurales, funcionales/bioactivas e información genética. compr. Rev. Ciencia de los alimentos. Seguridad alimentaria. 20, 2534–2559 (2021).

Artículo CAS PubMed Google Scholar

Francoz, E., Ranocha, P., Burlat, V. & Dunand, C. Células secretoras de mucílago de semillas de Arabidopsis: regulación y dinámica. Tendencias de ciencia vegetal. 20, 515–524 (2015).

Artículo CAS PubMed Google Scholar

Western, TL y cols. MUCILAGE-MODIFIED4 codifica una supuesta enzima biosintética de pectina regulada durante el desarrollo por APETALA2, TESTA TRANSPARENTE GLABRA1 y GLABRA2 en la cubierta de la semilla de Arabidopsis. Fisiol vegetal. 134, 296 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Takenaka, Y. et al. Las pectina RG-I ramnosiltransferasas representan una nueva familia de glicosiltransferasas específicas de plantas. Nat. Plantas 4, 669–676 (2018).

Artículo CAS PubMed Google Scholar

Yu, L. et al. La celulosa sintasa A2, una glucomanano sintasa, participa en el mantenimiento de la estructura del mucílago adherente en la semilla de Arabidopsis. Fisiol vegetal. 164, 1842–1856 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Mendú, V. et al. La subfuncionalización de las celulosa sintasas en las células epidérmicas de la cubierta de la semilla media la síntesis de la pared radial secundaria y la unión del mucílago. Fisiol vegetal. 157, 441–453 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Ben-Tov, D. et al. COBRA-LIKE2, un miembro de la familia COBRA-LIKE anclada en glicosilfosfatidilinositol, desempeña un papel en la deposición de celulosa en las células secretoras de mucílago de la cubierta de la semilla de Arabidopsis. Fisiol vegetal. 167, 711 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Haughn, GW & Western, TL El mucílago de la cubierta de la semilla de Arabidopsis es una pared celular especializada que puede usarse como modelo para el análisis genético de la estructura y función de la pared celular de las plantas. Ciencia vegetal frontal. 3, 64 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Golz, JF y cols. Capas de regulación: conocimientos sobre el papel de los factores de transcripción que controlan la producción de mucílago en la cubierta de la semilla de Arabidopsis. Ciencia vegetal. 272, 179-192 (2018).

Artículo CAS PubMed Google Scholar

Jamet, E. y Dunand, C. Proteínas y desarrollo de la pared celular vegetal. En t. J. Mol. Ciencia. 21, (2020).

Sandoval-Oliveros, MR & Paredes-López, O. Aislamiento y caracterización de proteínas de semillas de chía (Salvia hispanica L.). J. Química agrícola de alimentos. 61, 193–201 (2013).

Artículo CAS PubMed Google Scholar

Tsai, AYL y cols. Identificación y caracterización de proteínas del mucílago de la cubierta de la semilla de Arabidopsis. Fisiol vegetal. 173, 1059-1074 (2017).

Artículo CAS PubMed Google Scholar

Paniagua, C. et al. Proteínas dirigientes en plantas: modulación del metabolismo de la pared celular durante la exposición al estrés biótico y abiótico. J. Exp. Bot. 68, 3287–3301 (2017).

Artículo CAS PubMed Google Scholar

Yonekura-Sakakibara, K. et al. Los neolignanos protectores de la cubierta de la semilla son producidos por la proteína dirigente AtDP1 y la lacasa AtLAC5 en Arabidopsis. Célula vegetal 33, 129-152 (2021).

PubMed Google Académico

Dalisay, DS et al. Formación de lignanos mediada por proteínas Dirigent y glucósidos cianogénicos en semillas de lino: ómicas integradas e imágenes de espectrometría de masas MALDI. J. Nat. Pinchar. 78, 1231-1242 (2015).

Artículo CAS PubMed Google Scholar

Davin, LB y Lewis, NG Estructuras primarias de lignina y sitios dirigentes. actual. Opinión. Biotecnología. 16, 407–415 (2005).

Artículo CAS PubMed Google Scholar

Bonello, P., Storer, AJ, Gordon, TR, Wood, DL y Heller, W. Efectos sistémicos de Heterobasidion annosum sobre el glucósido de ácido ferúlico y la lignina del floema presintomático del pino ponderosa y efectos potenciales sobre los hongos asociados al escarabajo de la corteza. J. química. Ecológico. 29, 1167-1182 (2003).

Artículo CAS PubMed Google Scholar

Miedes, E., Vanholme, R., Boerjan, W. & Molina, A. El papel de la pared celular secundaria en la resistencia de las plantas a los patógenos. Frente. Ciencia vegetal. 5, (2014).

Thamil Arasan, SK y cols. Caracterización y análisis de expresión de genes familiares dirigentes relacionados con estreses en Brassica. Fisiol vegetal. Bioquímica 67, 144-153 (2013).

Artículo CAS PubMed Google Scholar

Jin-long, G. et al. Un nuevo gen de proteína dirigente con expresión altamente específica del tallo de la caña de azúcar, respuesta a la sequía, la sal y el estrés oxidativo. Representante de células vegetales 31, 1801–1812 (2012).

Artículo PubMed Google Scholar

Ponce De León, I. et al. Physcomitrella patens activa el refuerzo de la pared celular, la muerte celular programada y la acumulación de señales de defensa conservadas evolutivamente, como el ácido salicílico y el ácido 12-oxo-fitodienoico, pero no el ácido jasmónico, tras la infección por Botrytis cinerea. Mol. Patol de plantas. 13, 960–974 (2012).

Artículo PubMed PubMed Central Google Scholar

Reboledo, G. et al. Physcomitrella patens activa respuestas de defensa contra el patógeno Colletotrichum gloeosporioides. Int. J. Mol. Saber 16, 22280 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Tsai, AYL, McGee, R., Dean, GH, Haughn, GW & Sawa, S. Mucílago de semillas: funciones biológicas y aplicaciones potenciales en biotecnología. Fisiol de células vegetales. 62, 1847–1857 (2021).

Artículo CAS PubMed Google Scholar

Motyka, S. y col. Estado Actual del Conocimiento sobre Salvia hispanica y semen de Salviae hispanicae (Semillas de Chía). Moléculas 27, (2022).

Wimberley, J., Cahill, J. & Atamian, HS Secuenciación y análisis de novo del transcriptoma específico de tejido de Salvia hispanica e identificación de genes implicados en la biosíntesis de terpenoides. Plantas 2020 9, 405 (2020).

CAS Google Académico

Peterson, DG, Boehm, KS y Stack, SM Aislamiento de miligramos de ADN nuclear de tomate (Lycopersicon esculentum), una planta que contiene altos niveles de compuestos polifenólicos. Planta Mol. Biol. Informe. 15, 148-153 (1997).

Artículo CAS Google Scholar

Marçais, G. & Kingsford, C. Un enfoque rápido y sin bloqueos para el recuento paralelo eficiente de apariciones de k-mers. Bioinformática 27, 764–770 (2011).

Artículo PubMed PubMed Central Google Scholar

Sun, H., DIng, J., Piednoël, M. & Schneeberger, K. findGSE: estimación de la variación del tamaño del genoma en humanos y Arabidopsis utilizando frecuencias de k-mer. Bioinformática 34, 550–557 (2018).

Artículo CAS PubMed Google Scholar

Langmead, B. & Salzberg, SL Alineación rápida de lectura entre espacios con Bowtie 2. Nat. Métodos 9, 357–359 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. Minimap2: Alineación por pares para secuencias de nucleótidos. Bioinformática 34, 3094–3100 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Cabanettes, F. & Klopp, C. D-GENIES: Trazar genomas grandes de forma interactiva, eficiente y sencilla. PeerJ 2018, e4958 (2018).

Artículo de Google Scholar

Ni, P. y col. Detección de todo el genoma de metilaciones de citosina en plantas a partir de datos de Nanopore mediante aprendizaje profundo. Nat. Comunitario. 12, (2021).

Kim, D., Paggi, JM, Park, C., Bennett, C. y Salzberg, SL Alineación del genoma basada en gráficos y genotipado con HISAT2 y genotipo HISAT. Nat. Biotecnología. 37, 907 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Pertea, M. et al. StringTie permite una reconstrucción mejorada de un transcriptoma a partir de lecturas de RNA-seq. Nat. Biotecnología. 33, 290–295 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Storer, J., Hubley, R., Rosen, J., Wheeler, TJ y Smit, AF El recurso comunitario de Dfam sobre familias de elementos transponibles, modelos de secuencia y anotaciones genómicas. Multitud. ADN 12, 1-14 (2021).

Artículo de Google Scholar

Ou, S. & Jiang, N. LTR_retriever: Un programa altamente preciso y sensible para la identificación de retrotransposones repetidos terminales largos. Fisiol vegetal. 176, 1410-1422 (2018).

Artículo CAS PubMed Google Scholar

Ou, S. & Jiang, N. LTR_FINDER_parallel: Paralelización de LTR_FINDER que permite una identificación rápida de retrotransposones repetidos terminales largos. Multitud. ADN 10, 1-3 (2019).

Artículo de Google Scholar

Xu, Z. & Wang, H. LTR-FINDER: Una herramienta eficaz para la predicción de retrotransposones LTR de longitud completa. Ácidos nucleicos Res 35, 265–268 (2007).

Artículo de Google Scholar

Ellinghaus, D., Kurtz, S. & Willhoeft, U. LTRharvest, un software eficiente y flexible para la detección de novo de retrotransposones LTR. BMC Bioinforma. 9, 1-14 (2008).

Artículo de Google Scholar

Stanke, M., Schöffmann, O., Morgenstern, B. & Waack, S. Predicción de genes en eucariotas con un modelo oculto generalizado de Markov que utiliza sugerencias de fuentes externas. BMC Bioinforma. 7, 1-11 (2006).

Artículo de Google Scholar

Manni, M., Berkeley, MR, Seppey, M., Simão, FA & Zdobnov, EM Actualización de BUSCO: flujos de trabajo novedosos y optimizados junto con una cobertura filogenética más amplia y profunda para la puntuación de genomas eucariotas, procarióticos y virales. Mol. Biol. Evolución. 38, 4647–4654 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Wimalanathan, K., Friedberg, I., Andorf, CM y Lawrence-Dill, CJ Anotación GO de maíz: métodos, evaluación y revisión (maize-GAMER). Planta Directa 2, e00052 (2018).

Artículo PubMed PubMed Central Google Scholar

Blum, M. y col. La base de datos de dominios y familias de proteínas de InterPro: 20 años después. Ácidos nucleicos res. 49, D344–D354 (2021).

Artículo CAS PubMed Google Scholar

Törönen, P., Medlar, A. & Holm, L. PANNZER2: un servidor web de anotación funcional rápida. Ácidos nucleicos res. 46, W84-W88 (2018).

Artículo PubMed PubMed Central Google Scholar

Sud, M. y col. LMSD: Base de datos de estructura LIPID MAPS. Ácidos nucleicos res. 35, D527–D532 (2007).

Artículo CAS PubMed Google Scholar

Bray, NL, Pimentel, H., Melsted, P. y Pachter, L. Cuantificación probabilística casi óptima de RNA-seq. Nat. Biotecnología. 34, 525–527 (2016).

Artículo CAS PubMed Google Scholar

Ritchie, ME y cols. limma potencia los análisis de expresión diferencial para estudios de microarrays y secuenciación de ARN. Ácidos nucleicos Res 43, e47 (2015).

Artículo PubMed PubMed Central Google Scholar

Chae, L., Kim, T., Nilo-Poyanco, R. & Rhee, SY Firmas genómicas del metabolismo especializado en plantas. Ciencia (1979) 344, 510–513 (2014).

CAS Google Académico

Love, MI, Huber, W. & Anders, S. Estimación moderada del cambio de pliegue y la dispersión para datos de RNA-seq con DESeq2. Genoma Biol. 15, 550 (2014).

Artículo PubMed PubMed Central Google Scholar

Jin, J. y col. PlantTFDB 4.0: hacia un centro central para factores de transcripción e interacciones regulatorias en plantas. Ácidos nucleicos Res 45, D1040 – D1045 (2017).

Artículo CAS PubMed Google Scholar

Descargar referencias

Este trabajo fue financiado por el programa Governor University Research Initiative (05-2018) del Estado de Texas.

Contribuyeron igualmente los siguientes autores: Héctor-Rogelio Nájera-González, Ricardo A. Chávez Montes.

Departamento de Ciencias Vegetales y del Suelo, Instituto de Genómica para la Tolerancia al Estrés Abiótico de los Cultivos (IGCAST), Universidad Tecnológica de Texas, Lubbock, TX, 79409, EE. UU.

Gerardo Alejo-Jacuinde, Héctor-Rogelio Nájera-González, Ricardo A. Chávez Montes, Alfonso Carlos Barragán-Rosillo, Benjamin Perez Sanchez, Damar López-Arredondo, Lenin Yong-Villalobos & Luis Herrera-Estrella

Departamento de Química y Bioquímica, Texas Tech University, Lubbock, TX, 79409, EE. UU.

Christian D. Gutiérrez Reyes & Need Mechref

Unidad de Genómica Avanzada/Langebio, Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional, Irapuato, Gto., 36821, Mexico

Luis Herrera-Estrella

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

GA-J., LY-V. y LH-E. concibió y diseñó el estudio; GA-J. y LY-V. material biológico generado para secuenciación del genoma; GA-J. realizó el ensamblaje del genoma; LY-V. realizó el análisis de metilación; RACM realizó la anotación del genoma; H.-RN-G., CDGR y YSM realizaron los análisis lipidómicos, metabólicos y proteómicos; GA-J. y RACM realizó el estudio de la biosíntesis de ácido rosmarínico y mucílago; ACB-R. y BPS realizó la caracterización del desarrollo de semillas de chía; GA-J., LY-V., RACM, H.-RN-G., DL-A. y LH-E. datos analizados; GA-J., LY-V. y LH-E. escribió el manuscrito. Todos los autores leyeron y aprobaron el manuscrito final.

Correspondence to Lenin Yong-Villalobos or Luis Herrera-Estrella.

Los autores declaran no tener conflictos de intereses.

Communications Biology agradece a Aizhong Liu y a los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Editores primarios: David Favero y Manuel Breuer. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Alejo-Jacuinde, G., Nájera-González, HR., Chávez Montes, R.A. et al. Multi-omic analyses reveal the unique properties of chia (Salvia hispanica) seed metabolism. Commun Biol 6, 820 (2023). https://doi.org/10.1038/s42003-023-05192-4

Descargar cita

Recibido: 28 de marzo de 2023

Aceptado: 28 de julio de 2023

Publicado: 07 de agosto de 2023

DOI: https://doi.org/10.1038/s42003-023-05192-4

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.