Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas

Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of th...

ver descrição completa

Autor principal: Souza, João Ewerton Duarte de
Formato: Trabalho de Conclusão de Curso (Graduação)
Idioma: Português
Publicado em: Universidade Tecnológica Federal do Paraná 2021
Assuntos:
Acesso em linha: http://repositorio.utfpr.edu.br/jspui/handle/1/26544
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id riut-1-26544
recordtype dspace
spelling riut-1-265442021-12-02T06:05:56Z Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas Souza, João Ewerton Duarte de Naves, Thiago França Naves, Thiago França Brilhador, Anderson Candido Junior, Arnaldo Visão por computador Arquitetura de computador Redes neurais (Computação) Computer vision Computer architecture Neural networks (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of this work is to synthesize, review and present the main concepts, configurations and applications that integrate Deep Learning and Computer Vision, through experiments and exploration of their configurations, methods and analyses. Families of Convolutional Neural Network, Autocoding Networks and architectures are explored, also Restricted Boltzmann Machines for pretraining, using the MNIST and CIFAR-10 image databases. The efficiency of the convolutional models in the classification task of the MNIST base and performance reduction when using the same configurations in the CIFAR-10 was observed. The Autocoder obtained satisfactory reconstruction error values and a good performance together with MobileNet in the classification task. The explored configurations can be used to help build solutions in Computer Vision tasks, and this work can be used as a guide for those who want to know or deepen their knowledge in Deep Learning applied to Computer Vision. Modelos baseados em Aprendizado Profundo ganharam notoriedade em diversas áreas, principalmente em Visão Computacional. Entretanto, devido à sua extensa literatura e o grande número de a serem ajustados, tornou-se um desafio para aqueles que desejam desenvolver soluções utilizando essa abordagem. Assim, o objetivo deste trabalho é sintetizar, revisar e apresentar os principais conceitos, configurações e aplicações que integram Aprendizado Profundo e Visão Computacional, através de experimentos e exploração de suas configurações, métodos e análises. São exploradas famílias de arquiteturas de Rede Neurais Convolucionais, Redes Auto codificadoras e Máquinas de Boltzmann Restritas como apoio para o pré treinamento, utilizando as bases de dados de imagens MNIST e CIFAR-10.Observou-se a eficiência dos modelos convolucionais na tarefa de classificação da base MNIST e redução do desempenho destes quando utilizadas as mesmas configurações na CIFAR-10. A Autocodificadora obteve valores de erros de reconstrução satisfatórios e um bom desempenho em conjunto com a Mobile Net na tarefa de classificação. As configurações exploradas podem ser utilizadas para auxiliar na construção de soluções em tarefas de Visão Computacional, e este trabalho pode ser utilizado como um guia para aqueles que pretendem conhecer ou aprofundar seus conhecimentos em Aprendizado Profundo aplicado à Visão Computacional. 2021-12-01T13:39:04Z 2021-12-01T13:39:04Z 2021-08-23 bachelorThesis SOUZA, João Ewerton Duarte de. Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2021. http://repositorio.utfpr.edu.br/jspui/handle/1/26544 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Santa Helena Brasil Ciência da Computação UTFPR
institution Universidade Tecnológica Federal do Paraná
collection RIUT
language Português
topic Visão por computador
Arquitetura de computador
Redes neurais (Computação)
Computer vision
Computer architecture
Neural networks (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
spellingShingle Visão por computador
Arquitetura de computador
Redes neurais (Computação)
Computer vision
Computer architecture
Neural networks (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Souza, João Ewerton Duarte de
Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
description Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of this work is to synthesize, review and present the main concepts, configurations and applications that integrate Deep Learning and Computer Vision, through experiments and exploration of their configurations, methods and analyses. Families of Convolutional Neural Network, Autocoding Networks and architectures are explored, also Restricted Boltzmann Machines for pretraining, using the MNIST and CIFAR-10 image databases. The efficiency of the convolutional models in the classification task of the MNIST base and performance reduction when using the same configurations in the CIFAR-10 was observed. The Autocoder obtained satisfactory reconstruction error values and a good performance together with MobileNet in the classification task. The explored configurations can be used to help build solutions in Computer Vision tasks, and this work can be used as a guide for those who want to know or deepen their knowledge in Deep Learning applied to Computer Vision.
format Trabalho de Conclusão de Curso (Graduação)
author Souza, João Ewerton Duarte de
author_sort Souza, João Ewerton Duarte de
title Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
title_short Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
title_full Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
title_fullStr Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
title_full_unstemmed Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
title_sort principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
publisher Universidade Tecnológica Federal do Paraná
publishDate 2021
citation SOUZA, João Ewerton Duarte de. Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/26544
_version_ 1805299392337412096
score 10,814766