Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of th...
Autor principal: | Souza, João Ewerton Duarte de |
---|---|
Formato: | Trabalho de Conclusão de Curso (Graduação) |
Idioma: | Português |
Publicado em: |
Universidade Tecnológica Federal do Paraná
2021
|
Assuntos: | |
Acesso em linha: |
http://repositorio.utfpr.edu.br/jspui/handle/1/26544 |
Tags: |
Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
|
id |
riut-1-26544 |
---|---|
recordtype |
dspace |
spelling |
riut-1-265442021-12-02T06:05:56Z Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas Souza, João Ewerton Duarte de Naves, Thiago França Naves, Thiago França Brilhador, Anderson Candido Junior, Arnaldo Visão por computador Arquitetura de computador Redes neurais (Computação) Computer vision Computer architecture Neural networks (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of this work is to synthesize, review and present the main concepts, configurations and applications that integrate Deep Learning and Computer Vision, through experiments and exploration of their configurations, methods and analyses. Families of Convolutional Neural Network, Autocoding Networks and architectures are explored, also Restricted Boltzmann Machines for pretraining, using the MNIST and CIFAR-10 image databases. The efficiency of the convolutional models in the classification task of the MNIST base and performance reduction when using the same configurations in the CIFAR-10 was observed. The Autocoder obtained satisfactory reconstruction error values and a good performance together with MobileNet in the classification task. The explored configurations can be used to help build solutions in Computer Vision tasks, and this work can be used as a guide for those who want to know or deepen their knowledge in Deep Learning applied to Computer Vision. Modelos baseados em Aprendizado Profundo ganharam notoriedade em diversas áreas, principalmente em Visão Computacional. Entretanto, devido à sua extensa literatura e o grande número de a serem ajustados, tornou-se um desafio para aqueles que desejam desenvolver soluções utilizando essa abordagem. Assim, o objetivo deste trabalho é sintetizar, revisar e apresentar os principais conceitos, configurações e aplicações que integram Aprendizado Profundo e Visão Computacional, através de experimentos e exploração de suas configurações, métodos e análises. São exploradas famílias de arquiteturas de Rede Neurais Convolucionais, Redes Auto codificadoras e Máquinas de Boltzmann Restritas como apoio para o pré treinamento, utilizando as bases de dados de imagens MNIST e CIFAR-10.Observou-se a eficiência dos modelos convolucionais na tarefa de classificação da base MNIST e redução do desempenho destes quando utilizadas as mesmas configurações na CIFAR-10. A Autocodificadora obteve valores de erros de reconstrução satisfatórios e um bom desempenho em conjunto com a Mobile Net na tarefa de classificação. As configurações exploradas podem ser utilizadas para auxiliar na construção de soluções em tarefas de Visão Computacional, e este trabalho pode ser utilizado como um guia para aqueles que pretendem conhecer ou aprofundar seus conhecimentos em Aprendizado Profundo aplicado à Visão Computacional. 2021-12-01T13:39:04Z 2021-12-01T13:39:04Z 2021-08-23 bachelorThesis SOUZA, João Ewerton Duarte de. Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2021. http://repositorio.utfpr.edu.br/jspui/handle/1/26544 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Santa Helena Brasil Ciência da Computação UTFPR |
institution |
Universidade Tecnológica Federal do Paraná |
collection |
RIUT |
language |
Português |
topic |
Visão por computador Arquitetura de computador Redes neurais (Computação) Computer vision Computer architecture Neural networks (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
spellingShingle |
Visão por computador Arquitetura de computador Redes neurais (Computação) Computer vision Computer architecture Neural networks (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Souza, João Ewerton Duarte de Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
description |
Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of this work is to synthesize, review and present the main concepts, configurations and applications that integrate Deep Learning and Computer Vision, through experiments and exploration of their configurations, methods and analyses. Families of Convolutional Neural Network, Autocoding Networks and architectures are explored, also Restricted Boltzmann Machines for pretraining, using the MNIST and CIFAR-10 image databases. The efficiency of the convolutional models in the classification task of the MNIST base and performance reduction when using the same configurations in the CIFAR-10 was observed. The Autocoder obtained satisfactory reconstruction error values and a good performance together with MobileNet in the classification task. The explored configurations can be used to help build solutions in Computer Vision tasks, and this work can be used as a guide for those who want to know or deepen their knowledge in Deep Learning applied to Computer Vision. |
format |
Trabalho de Conclusão de Curso (Graduação) |
author |
Souza, João Ewerton Duarte de |
author_sort |
Souza, João Ewerton Duarte de |
title |
Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
title_short |
Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
title_full |
Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
title_fullStr |
Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
title_full_unstemmed |
Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
title_sort |
principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
publisher |
Universidade Tecnológica Federal do Paraná |
publishDate |
2021 |
citation |
SOUZA, João Ewerton Duarte de. Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2021. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/26544 |
_version_ |
1805299392337412096 |
score |
10,814766 |