Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning...
Principais autores: | Acuña, Daniel Grimm, Luz, Henrique Santos da, Klein, Lucas Jurgen |
---|---|
Formato: | Trabalho de Conclusão de Curso (Graduação) |
Idioma: | Português |
Publicado em: |
Universidade Tecnológica Federal do Paraná
2020
|
Assuntos: | |
Acesso em linha: |
http://repositorio.utfpr.edu.br/jspui/handle/1/8198 |
Tags: |
Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
|
id |
riut-1-8198 |
---|---|
recordtype |
dspace |
spelling |
riut-1-81982020-11-11T14:01:30Z Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido Reinforcement learning algorithms applicability study on an inverted pendulum Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen Assef, Amauri Amorin Assef, Amauri Amorin Brante, Glauber Gomes de Oliveira Frencl, Victor Baptista Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works. Este trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros. 2020-11-11T14:01:30Z 2020-11-11T14:01:30Z 2019-07-09 bachelorThesis ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019. http://repositorio.utfpr.edu.br/jspui/handle/1/8198 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Curitiba Brasil Engenharia de Controle e Automação UTFPR |
institution |
Universidade Tecnológica Federal do Paraná |
collection |
RIUT |
language |
Português |
topic |
Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE |
spellingShingle |
Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
description |
This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works. |
format |
Trabalho de Conclusão de Curso (Graduação) |
author |
Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen |
author_sort |
Acuña, Daniel Grimm |
title |
Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
title_short |
Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
title_full |
Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
title_fullStr |
Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
title_full_unstemmed |
Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
title_sort |
estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido |
publisher |
Universidade Tecnológica Federal do Paraná |
publishDate |
2020 |
citation |
ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/8198 |
_version_ |
1805452901117591552 |
score |
10,814766 |