Registro fonte: Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido

Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido

This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning...

ver descrição completa

Principais autores:	Acuña, Daniel Grimm, Luz, Henrique Santos da, Klein, Lucas Jurgen
Formato:	Trabalho de Conclusão de Curso (Graduação)
Idioma:	Português
Publicado em:	Universidade Tecnológica Federal do Paraná 2020
Assuntos:	Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE
Acesso em linha:	http://repositorio.utfpr.edu.br/jspui/handle/1/8198
Tags:	Adicionar Tag Sem tags, seja o primeiro a adicionar uma tag!

id	riut-1-8198
recordtype	dspace
spelling	riut-1-81982020-11-11T14:01:30Z Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido Reinforcement learning algorithms applicability study on an inverted pendulum Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen Assef, Amauri Amorin Assef, Amauri Amorin Brante, Glauber Gomes de Oliveira Frencl, Victor Baptista Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works. Este trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros. 2020-11-11T14:01:30Z 2020-11-11T14:01:30Z 2019-07-09 bachelorThesis ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019. http://repositorio.utfpr.edu.br/jspui/handle/1/8198 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Curitiba Brasil Engenharia de Controle e Automação UTFPR
institution	Universidade Tecnológica Federal do Paraná
collection	RIUT
language	Português
topic	Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE
spellingShingle	Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
description	This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works.
format	Trabalho de Conclusão de Curso (Graduação)
author	Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen
author_sort	Acuña, Daniel Grimm
title	Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_short	Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_full	Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_fullStr	Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_full_unstemmed	Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_sort	estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
publisher	Universidade Tecnológica Federal do Paraná
publishDate	2020
citation	ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019.
url	http://repositorio.utfpr.edu.br/jspui/handle/1/8198
_version_	1805452901117591552
score	10,814766

Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido

Registros relacionados