Predição do desempenho no ENADE dos discentes de computação

The evaluation of higher education is important to ensure its quality, in addition to being of interest to students, teachers, governments and society. The National Higher Education Assessment System (SINAES) is an educational assessment network with several assessment methods, one of which is the N...

ver descrição completa

Autor principal: Capelari, Luis Otávio Oliveira
Formato: Trabalho de Conclusão de Curso (Graduação)
Idioma: Português
Publicado em: Universidade Tecnológica Federal do Paraná 2023
Assuntos:
Acesso em linha: http://repositorio.utfpr.edu.br/jspui/handle/1/30729
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id riut-1-30729
recordtype dspace
spelling riut-1-307292023-03-07T06:07:35Z Predição do desempenho no ENADE dos discentes de computação Performance prediction in ENADE of computing students Capelari, Luis Otávio Oliveira Schwerz, André Luís Schwerz, André Luís Gonçalves, Diego Bertolini Foleiss, Juliano Henrique Aprendizado do computador Mineração de dados (Computação) Estudantes universitários Machine learning Data mining College students CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO The evaluation of higher education is important to ensure its quality, in addition to being of interest to students, teachers, governments and society. The National Higher Education Assessment System (SINAES) is an educational assessment network with several assessment methods, one of which is the National Student Performance Examination (ENADE), which is organized by the National Institute for Educational Studies and Research Anísio Teixeira (INEP). ENADE evaluates undergraduate course students who are in the final year of the course or who have completed at least 80% of the course workload. This exam has an evaluation cycle of three years, evaluating a set of different courses in each of these years, with courses in the computing area being evaluated in Year II. The results of assessments and complementary questionnaires are made available as open data by INEP, serving as a rich source for analysis and the discovery of new knowledge. Although the data are available, scientific research that explores their relationships and evolutions is still restricted, especially with regard to the identification of factors that help decision-making by managers of Higher Education Institutions. With this in mind, the objective of the present work is to use the Discovery of Knowledge in Database method together with classification techniques to predict the performance of computing students participating in ENADE based on socioeconomic factors, seeking to discover the best model. of classification and what is the best cut-off point to generate classes of the participants’ performance. In this work, five classification models were evaluated: Decision Tree, K-nearest neighbors, Support Vector Machine, Random Forest and Logistic Regression; in addition to testing five ways of classifying participants according to performance. As a result, it was found that the best combination for classifying participants’ performance is to use the Support Vector Machine model, adopting the median as a way of separating the classes of participants. The result obtained contributes to the understanding of how ENADE data can be used to predict the performance of participants, in the definition of Machine Learning models suitable for this context, in addition to the discovery of how the way participants’ performance is divided impacts the performance of classification models and which one is the most suitable. A avaliação da educação superior é importante para garantir sua qualidade, além de ser do interesse de discentes, docentes, governos e da sociedade. O Sistema Nacional de Avaliação da Educação Superior (SINAES) é uma rede de avaliação educacional com vários métodos de avaliação, sendo um deles o Exame Nacional de Desempenho de Estudantes (ENADE), que é organizado pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). O ENADE avalia os alunos de cursos de graduação que estão no último ano do curso ou completaram no mínimo 80% da carga horaria do curso. Esse exame possui um ciclo avaliativo de três anos, avaliando um conjunto de cursos diferentes em cada um desses anos, sendo os cursos da área de computação avaliados no Ano II. O resultado das avaliações e dos questionários complementares são disponibilizados como dados abertos pelo INEP, servindo como fonte rica para análises e a descoberta de novos conhecimentos. Embora os dados estejam disponíveis, ainda são restritas as pesquisas cientificas que exploram suas relações e evoluções, principalmente, no que diz respeito a identificação de fatores que auxiliam a tomada de decisão dos gestores das Instituições de Ensino Superior. Tendo isso em mente, o objetivo do presente trabalho é utilizar o método de Descoberta de Conhecimento em Base de Dados junto a técnicas de classificação para predizer o desempenho dos discentes de computação participantes do ENADE a partir de fatores socioeconômicos, buscando descobrir qual o melhor modelo de classificação e qual o melhor ponto de corte para gerar classes do desempenho dos participantes. Nesse trabalho foram avaliados cinco modelos de classificação: Árvore de Decisão, K-vizinhos mais próximos, Máquina de Vetores de Suporte, Floresta Aleatória e Regressão Logística; além de serem testadas cinco formas de classificar os participantes de acordo com o desempenho. Como resultado, foi descoberto que a melhor combinação para a classificação de desempenho dos participantes é a utilização do modelo Máquina de Vetores de Suporte adotando a mediana como forma de separar as classes de participantes. O resultado obtido contribui no entendimento de como os dados do ENADE podem ser utilizados para predizer o desempenho dos participantes, na definição de modelos de Aprendizado de Máquina adequados para esse contexto, além da descoberta de como a forma de divisão de desempenho dos participantes impacta no desempenho dos modelos de classificação e de qual delas é a mais indicada. 2023-03-06T20:20:54Z 2023-03-06T20:20:54Z 2022-06-15 bachelorThesis CAPELARI, Luis Otávio Oliveira. Predição do desempenho no ENADE dos discentes de computação. 2022. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2022. http://repositorio.utfpr.edu.br/jspui/handle/1/30729 por openAccess http://creativecommons.org/licenses/by/4.0/ application/pdf Universidade Tecnológica Federal do Paraná Campo Mourao Brasil Departamento Acadêmico de Computação Ciência da Computação UTFPR
institution Universidade Tecnológica Federal do Paraná
collection RIUT
language Português
topic Aprendizado do computador
Mineração de dados (Computação)
Estudantes universitários
Machine learning
Data mining
College students
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
spellingShingle Aprendizado do computador
Mineração de dados (Computação)
Estudantes universitários
Machine learning
Data mining
College students
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Capelari, Luis Otávio Oliveira
Predição do desempenho no ENADE dos discentes de computação
description The evaluation of higher education is important to ensure its quality, in addition to being of interest to students, teachers, governments and society. The National Higher Education Assessment System (SINAES) is an educational assessment network with several assessment methods, one of which is the National Student Performance Examination (ENADE), which is organized by the National Institute for Educational Studies and Research Anísio Teixeira (INEP). ENADE evaluates undergraduate course students who are in the final year of the course or who have completed at least 80% of the course workload. This exam has an evaluation cycle of three years, evaluating a set of different courses in each of these years, with courses in the computing area being evaluated in Year II. The results of assessments and complementary questionnaires are made available as open data by INEP, serving as a rich source for analysis and the discovery of new knowledge. Although the data are available, scientific research that explores their relationships and evolutions is still restricted, especially with regard to the identification of factors that help decision-making by managers of Higher Education Institutions. With this in mind, the objective of the present work is to use the Discovery of Knowledge in Database method together with classification techniques to predict the performance of computing students participating in ENADE based on socioeconomic factors, seeking to discover the best model. of classification and what is the best cut-off point to generate classes of the participants’ performance. In this work, five classification models were evaluated: Decision Tree, K-nearest neighbors, Support Vector Machine, Random Forest and Logistic Regression; in addition to testing five ways of classifying participants according to performance. As a result, it was found that the best combination for classifying participants’ performance is to use the Support Vector Machine model, adopting the median as a way of separating the classes of participants. The result obtained contributes to the understanding of how ENADE data can be used to predict the performance of participants, in the definition of Machine Learning models suitable for this context, in addition to the discovery of how the way participants’ performance is divided impacts the performance of classification models and which one is the most suitable.
format Trabalho de Conclusão de Curso (Graduação)
author Capelari, Luis Otávio Oliveira
author_sort Capelari, Luis Otávio Oliveira
title Predição do desempenho no ENADE dos discentes de computação
title_short Predição do desempenho no ENADE dos discentes de computação
title_full Predição do desempenho no ENADE dos discentes de computação
title_fullStr Predição do desempenho no ENADE dos discentes de computação
title_full_unstemmed Predição do desempenho no ENADE dos discentes de computação
title_sort predição do desempenho no enade dos discentes de computação
publisher Universidade Tecnológica Federal do Paraná
publishDate 2023
citation CAPELARI, Luis Otávio Oliveira. Predição do desempenho no ENADE dos discentes de computação. 2022. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2022.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30729
_version_ 1805453025123237888
score 10,814766