Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido

This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning...

ver descrição completa

Principais autores: Acuña, Daniel Grimm, Luz, Henrique Santos da, Klein, Lucas Jurgen
Formato: Trabalho de Conclusão de Curso (Graduação)
Idioma: Português
Publicado em: Universidade Tecnológica Federal do Paraná 2020
Assuntos:
Acesso em linha: http://repositorio.utfpr.edu.br/jspui/handle/1/8198
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id riut-1-8198
recordtype dspace
spelling riut-1-81982020-11-11T14:01:30Z Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido Reinforcement learning algorithms applicability study on an inverted pendulum Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen Assef, Amauri Amorin Assef, Amauri Amorin Brante, Glauber Gomes de Oliveira Frencl, Victor Baptista Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works. Este trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros. 2020-11-11T14:01:30Z 2020-11-11T14:01:30Z 2019-07-09 bachelorThesis ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019. http://repositorio.utfpr.edu.br/jspui/handle/1/8198 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Curitiba Brasil Engenharia de Controle e Automação UTFPR
institution Universidade Tecnológica Federal do Paraná
collection RIUT
language Português
topic Algoritmos
Controle automático
Kalman, Filtragem de
Markov, Processos de
Aprendizado por reforço
Algorithms
Automatic control
Kalman filtering
Markov processes
Reinforcement learning
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE
spellingShingle Algoritmos
Controle automático
Kalman, Filtragem de
Markov, Processos de
Aprendizado por reforço
Algorithms
Automatic control
Kalman filtering
Markov processes
Reinforcement learning
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE
Acuña, Daniel Grimm
Luz, Henrique Santos da
Klein, Lucas Jurgen
Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
description This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works.
format Trabalho de Conclusão de Curso (Graduação)
author Acuña, Daniel Grimm
Luz, Henrique Santos da
Klein, Lucas Jurgen
author_sort Acuña, Daniel Grimm
title Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_short Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_full Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_fullStr Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_full_unstemmed Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
title_sort estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
publisher Universidade Tecnológica Federal do Paraná
publishDate 2020
citation ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/8198
_version_ 1805452901117591552
score 10,814766