Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo

Autism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified acc...

ver descrição completa

Autor principal: Pereira, Hudson
Formato: Dissertação
Idioma: Português
Publicado em: Universidade Tecnológica Federal do Paraná 2022
Assuntos:
Acesso em linha: http://repositorio.utfpr.edu.br/jspui/handle/1/30201
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id riut-1-30201
recordtype dspace
spelling riut-1-302012022-11-30T06:07:00Z Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo Pereira, Hudson Paschoal, Alexandre Rossi 0000-0002-8887-0582 http://lattes.cnpq.br/5834088144837137 Queiroz, Artur Trancoso Lopo de http://lattes.cnpq.br/5222182427171497 Paschoal, Alexandre Rossi http://lattes.cnpq.br/5834088144837137 Sanches, Danilo Sipoli http://lattes.cnpq.br/6377657274398145 Freitas, Flavia Cristina de Paula http://lattes.cnpq.br/5139566975444110 Oliveira, Jaqueline Carvalho de http://lattes.cnpq.br/8730828720954911 Martins, Marcella Scoczynski Ribeiro http://lattes.cnpq.br/5212122361603572 Ácido ribonucleico - Síntese Autismo Bioinformática RNA - Synthesis Autism Bioinformatics CNPQ::CIENCIAS EXATAS E DA TERRA Engenharia/Tecnologia/Gestão Autism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified according to severity into: mild, moderate and severe. Early diagnosis of autism is essential for effective treatment. Transcriptomic analyzes are a means of obtaining regulatory information to understand ASD. In this sense, this work presents the result of a meta-analysis on publicly available gene expression data from ASD in associated studies. The methodology applied consisted of using expression data obtained after a review of the literature on ASD, being, three sets of selected data, collected in the NCBI GEO portal in December/19, and analyzed via RNA-Seq data the key genes related to TEA The RNA- Seq analysis pipeline was used to: (i) extract data in SRA using fastq-dump, in Rstudio; (ii) evaluation and quality control via the Trimmomatic program, in which the quality cut of the sequences was performed; (iii) then, the data were aligned with the reference genome (GRCh38) using Salmon and applied to estimate quantification and transcription level; and (iv) txtimport was used to assemble the counting matrix, finally, we used DESeq for differential expression analysis. The scatter analysis of expression data was displayed graphically using Vulcan. Then, the PCA (Principal component analysis) technique for analysis of groups, together with the analysis of enriched genes, using the terms of the GO, we identified potentials, groups and functions of the analyzed genes, being possible to identify a total of ten genes differentially. expressed, being three genes highly expressed and seven genes with low expression. Of these genes, eight are protein-coding, and two are small RNAs. In addition, it was observed that some genes are related to another genetic disease, in this case schizophrenia. A síndrome do Transtorno do Espectro do Autismo (TEA) é caracterizada por dificuldades de interação, desvio na comunicação e comportamentos repetitivos. Essa síndrome também é definida como perda de contato com a realidade, causada por impossibilidade ou grande dificuldade na comunicação interpessoal. O TEA pode ser classificado de acordo com a gravidade em: leve, moderado e grave. O diagnóstico precoce do autismo é essencial para um tratamento eficaz. As análises transcriptomicas são um meio de obter informações regulatórias para entender o TEA. Nesse sentido, este trabalho apresenta o resultado de uma meta-análise em dados públicos de expressão gênica disponíveis do TEA em estudos associados. A metodologia aplicada consistiu em utilizarmos dados de expressão obtidos após uma revisão da literatura sobre a TEA, Sendo, três conjuntos de dados selecionados, coletados no portal NCBI GEO em Dezembro/19, e analisados via dados RNA-Seq os genes chaves relativos à TEA. O pipeline de análise de RNA-Seq foi utilizado para: (i) extração dos dados em SRA utilizando o fastq-dump, no Rstudio; (ii) avaliação e controle de qualidade via programa Trimmomatic, no qual foi feito o corte de qualidade das sequências; (iii) em seguida, os dados foram alinhados com o genoma de referência (GRCh38) utilizando o Salmon e aplicado a estimativa de quantificação e nível de transcrição; e (iv) o txtimport foi utilizado para a montagem da matriz de contagem, por fim, utilizamos o DESeq para análise de expressão diferencial. A análise da dispersão dos dados de expressão foram exibidos graficamente usando o Vulcano. Em seguida, a técnica PCA (do inglês Principal component analysis) para análise de grupos, junto com a análise de genes enriquecidos, utilizando os termos do GO, identificamos potenciais, grupos e funções dos genes analisados sendo possível identificar um total de dez genes diferencialmente expressos, sendo três genes altamente expressos e sete genes com baixa expressão. Destes genes, oito são codificadores de proteínas, e dois RNAs pequenos. Além disso, foi observado que alguns genes apresentam relação com outra doença genética, no caso a esquizofrenia. 2022-11-29T17:01:24Z 2022-11-29T17:01:24Z 2022-04-08 masterThesis PEREIRA, Hudson. Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo. 2022. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022. http://repositorio.utfpr.edu.br/jspui/handle/1/30201 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Bioinformática UTFPR
institution Universidade Tecnológica Federal do Paraná
collection RIUT
language Português
topic Ácido ribonucleico - Síntese
Autismo
Bioinformática
RNA - Synthesis
Autism
Bioinformatics
CNPQ::CIENCIAS EXATAS E DA TERRA
Engenharia/Tecnologia/Gestão
spellingShingle Ácido ribonucleico - Síntese
Autismo
Bioinformática
RNA - Synthesis
Autism
Bioinformatics
CNPQ::CIENCIAS EXATAS E DA TERRA
Engenharia/Tecnologia/Gestão
Pereira, Hudson
Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
description Autism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified according to severity into: mild, moderate and severe. Early diagnosis of autism is essential for effective treatment. Transcriptomic analyzes are a means of obtaining regulatory information to understand ASD. In this sense, this work presents the result of a meta-analysis on publicly available gene expression data from ASD in associated studies. The methodology applied consisted of using expression data obtained after a review of the literature on ASD, being, three sets of selected data, collected in the NCBI GEO portal in December/19, and analyzed via RNA-Seq data the key genes related to TEA The RNA- Seq analysis pipeline was used to: (i) extract data in SRA using fastq-dump, in Rstudio; (ii) evaluation and quality control via the Trimmomatic program, in which the quality cut of the sequences was performed; (iii) then, the data were aligned with the reference genome (GRCh38) using Salmon and applied to estimate quantification and transcription level; and (iv) txtimport was used to assemble the counting matrix, finally, we used DESeq for differential expression analysis. The scatter analysis of expression data was displayed graphically using Vulcan. Then, the PCA (Principal component analysis) technique for analysis of groups, together with the analysis of enriched genes, using the terms of the GO, we identified potentials, groups and functions of the analyzed genes, being possible to identify a total of ten genes differentially. expressed, being three genes highly expressed and seven genes with low expression. Of these genes, eight are protein-coding, and two are small RNAs. In addition, it was observed that some genes are related to another genetic disease, in this case schizophrenia.
format Dissertação
author Pereira, Hudson
author_sort Pereira, Hudson
title Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_short Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_full Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_fullStr Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_full_unstemmed Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_sort análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
publisher Universidade Tecnológica Federal do Paraná
publishDate 2022
citation PEREIRA, Hudson. Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo. 2022. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30201
_version_ 1805318210401075200
score 10,814766