Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica

The following research is in the context of a production cycle of a clinical laboratory in the genomic area. This work proposed a dimensionality reduction method that helps the diagnosis for the genomic laboratory medicine. The new method of data size reduction is called DRM-F and it is able to iden...

ver descrição completa

Autor principal: Macedo, Dayana Carla de
Formato: Tese
Idioma: Português
Publicado em: Universidade Tecnológica Federal do Paraná 2017
Assuntos:
Acesso em linha: http://repositorio.utfpr.edu.br/jspui/handle/1/2481
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id riut-1-2481
recordtype dspace
spelling riut-1-24812017-09-25T21:26:04Z Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica Method of reduction of data dimensionality derived from the domain of gene expression Macedo, Dayana Carla de Francisco, Antonio Carlos de http://lattes.cnpq.br/6457056051910603 Matos, Simone Nasser http://lattes.cnpq.br/2608583610949216 Artoni, Roberto Ferreira Vaz, Maria Salete Marcon Gomes Trojan, Flavio Sola, Antonio Vanderley Herrero Genômica Biologia molecular Genética - Pesquisa Diagnóstico de laboratório Genomics Molecular biology Genetics - Research Diagnosis, Laboratory CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO Engenharia de Produção The following research is in the context of a production cycle of a clinical laboratory in the genomic area. This work proposed a dimensionality reduction method that helps the diagnosis for the genomic laboratory medicine. The new method of data size reduction is called DRM-F and it is able to identify on bases of this domain the most relevant (gene) attributes, by means of equivalence and generalization concepts. The DRM-F Method was compared to the Attributes Selection Method. This comparison aimed to assess the proposed method with the existing method for data mining, Attributes Selection. In the DRM-F Method based on Framework used equivalence and generalization concepts. These two methods have been applied in the domain of gene expression using three bases, named DLBCL, DLBCL tumor regarding leukemia and ALL/AML containing lymphoma data. Analyzing the results, using as assessment criteria the Cross Validation, it was found that the use of the methods resulted in an improvement in the hit ratio values as compared with bases having all the attributes in the domain of gene expression. In this area the best reduction method was achieved by using the wrapper approach in the three bases. Nevertheless, it is noteworthy that the proposed method showed a result of over 80% in accuracy rate, which cannot be considered a reduction method with poor performance. Although the DRM-F Method presented results below the attributes selection method, in general it showed no average hit rate lower than 80% in the generation of predictive models. The DRM-F Method, aims to extract common and specific (gene) attributes from the field of study, gene expression, but not only from a single base, but among all the bases belonging to the domain. Thus, one can obtain the (gene) attributes common among the various diseases analyzed between the bases. In the present experiment, it was possible to extract the common and specific (gene) attributes among the analyzed diseases. With the (gene) attributes common and specific to each disease it is possible to submit these subsets to biological analysis in order to verify the biological significance of the attributes with the objective of contributing to the area of biomedical diagnostics and routing. Capes A respectiva pesquisa encontra-se no contexto de um ciclo produtivo de um laboratório de análises clínicas da área genômica. Esse trabalho propôs um método de redução de dimensionalidade que auxilia o diagnóstico para a medicina laboratorial genômica. O novo método de redução de dimensão de dados é chamado de DRM-F e é capaz de identificar em bases deste domínio os atributos (gene) mais relevantes, por meio de conceitos de equivalência e generalização. Foi efetuada a comparação do Método DRM-F com o Método de Seleção de Atributos. Essa comparação objetivou a avaliação do método proposto com o método já existente na mineração de dados, Seleção de Atributos. O Método DRM-F fundamentado em Framework usou conceitos de equivalência e generalização. Esses dois métodos foram aplicados no domínio de expressão de genes usando três bases, denominadas DLBCL, DLBCL Tumor sobre leucemia e ALL/AML contendo dados do linfoma. Analisando os resultados obtidos, utilizando como critérios de avaliação a Validação Cruzada, verificou-se que o uso dos métodos resultou em uma melhora nos valores de taxa de acerto quando comparados com as bases, possuindo todos os atributos no domínio de expressão gênica. Nesse domínio, o melhor método de redução foi com o uso da Abordagem Wrapper nas três bases. Não obstante, ressalta-se que o método proposto apresentou um resultado superior a 80% de taxa de acerto, não podendo ser considerado um método de redução com desempenho ruim. O Método DRM-F, embora tenha apresentado resultados inferiores ao método de Seleção de Atributos, na média geral não apresentou taxa de acerto inferior a 80% na geração de modelos preditivos. O Método DRM-F busca extrair os atributos (gene) comuns e específicos do domínio de estudo, expressão gênica, porém não somente de uma única base, mas, entre todas as bases que pertencem ao domínio. Assim, podem-se obter os atributos (gene) comuns entre as várias doenças analisadas entre as bases. No presente experimento, foi possível extrair os atributos (gene) comuns e específicos entre as doenças analisadas. Com os atributos (gene) comuns e específicos de cada doença, podem-se submeter esses subconjuntos a uma análise biológica, a fim de verificar o significado biológico dos atributos objetivando uma contribuição na área biomédica e direcionamento de diagnósticos. 2017-09-25T21:26:03Z 5000 2017-09-25T21:26:03Z 2015-08-21 doctoralThesis MACEDO, Dayana Carla de. Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica. 2015. 143 f. Tese (Doutorado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2015. http://repositorio.utfpr.edu.br/jspui/handle/1/2481 por embargoedAccess application/pdf Universidade Tecnológica Federal do Paraná Ponta Grossa Brasil Programa de Pós-Graduação em Engenharia de Produção UTFPR
institution Universidade Tecnológica Federal do Paraná
collection RIUT
language Português
topic Genômica
Biologia molecular
Genética - Pesquisa
Diagnóstico de laboratório
Genomics
Molecular biology
Genetics - Research
Diagnosis, Laboratory
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Engenharia de Produção
spellingShingle Genômica
Biologia molecular
Genética - Pesquisa
Diagnóstico de laboratório
Genomics
Molecular biology
Genetics - Research
Diagnosis, Laboratory
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Engenharia de Produção
Macedo, Dayana Carla de
Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
description The following research is in the context of a production cycle of a clinical laboratory in the genomic area. This work proposed a dimensionality reduction method that helps the diagnosis for the genomic laboratory medicine. The new method of data size reduction is called DRM-F and it is able to identify on bases of this domain the most relevant (gene) attributes, by means of equivalence and generalization concepts. The DRM-F Method was compared to the Attributes Selection Method. This comparison aimed to assess the proposed method with the existing method for data mining, Attributes Selection. In the DRM-F Method based on Framework used equivalence and generalization concepts. These two methods have been applied in the domain of gene expression using three bases, named DLBCL, DLBCL tumor regarding leukemia and ALL/AML containing lymphoma data. Analyzing the results, using as assessment criteria the Cross Validation, it was found that the use of the methods resulted in an improvement in the hit ratio values as compared with bases having all the attributes in the domain of gene expression. In this area the best reduction method was achieved by using the wrapper approach in the three bases. Nevertheless, it is noteworthy that the proposed method showed a result of over 80% in accuracy rate, which cannot be considered a reduction method with poor performance. Although the DRM-F Method presented results below the attributes selection method, in general it showed no average hit rate lower than 80% in the generation of predictive models. The DRM-F Method, aims to extract common and specific (gene) attributes from the field of study, gene expression, but not only from a single base, but among all the bases belonging to the domain. Thus, one can obtain the (gene) attributes common among the various diseases analyzed between the bases. In the present experiment, it was possible to extract the common and specific (gene) attributes among the analyzed diseases. With the (gene) attributes common and specific to each disease it is possible to submit these subsets to biological analysis in order to verify the biological significance of the attributes with the objective of contributing to the area of biomedical diagnostics and routing.
format Tese
author Macedo, Dayana Carla de
author_sort Macedo, Dayana Carla de
title Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
title_short Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
title_full Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
title_fullStr Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
title_full_unstemmed Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
title_sort método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
publisher Universidade Tecnológica Federal do Paraná
publishDate 2017
citation MACEDO, Dayana Carla de. Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica. 2015. 143 f. Tese (Doutorado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2015.
url http://repositorio.utfpr.edu.br/jspui/handle/1/2481
_version_ 1805323207395246080
score 10,814766