Registro fonte: Criação de um banco de dados não relacional a partir de informação extraída de textos

Criação de um banco de dados não relacional a partir de informação extraída de textos

Information and data are currently concentrated in huge amounts within text files. And the fact that most information treated by humans is in unstructured texts justifies the importance of extracting data. The purpose of this paper is to develop an application capable of analyzing and extracting use...

ver descrição completa

Principais autores:	Xavier, Eduardo Semkiw, Batista, Jonathan da Silva
Formato:	Trabalho de Conclusão de Curso (Graduação)
Idioma:	Português
Publicado em:	Universidade Tecnológica Federal do Paraná 2020
Assuntos:	Banco de dados não relacionais Processamento de textos (Computação) Análise de envoltória de dados Non-relational databases Text processing (Computer science) Data envelopment analysis CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Acesso em linha:	http://repositorio.utfpr.edu.br/jspui/handle/1/16814
Tags:	Adicionar Tag Sem tags, seja o primeiro a adicionar uma tag!

id	riut-1-16814
recordtype	dspace
spelling	riut-1-168142020-11-19T21:06:10Z Criação de um banco de dados não relacional a partir de informação extraída de textos Creation of a non-relational database from information extracted from texts Xavier, Eduardo Semkiw Batista, Jonathan da Silva Koscianski, André Koscianski, André Morais, Erikson Freitas de Bini, Tarcizio Alexandre Banco de dados não relacionais Processamento de textos (Computação) Análise de envoltória de dados Non-relational databases Text processing (Computer science) Data envelopment analysis CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Information and data are currently concentrated in huge amounts within text files. And the fact that most information treated by humans is in unstructured texts justifies the importance of extracting data. The purpose of this paper is to develop an application capable of analyzing and extracting useful information from PDF files. The application will use an external tool to convert PDF and extract the content into text file. It will then search for patterns, such as addresses and dates. Finally, it will store the treated data in a NoSQL database. Since the extraction of information in PDF files generates a large amount of data, there is a need for automated support to the user, due to the difficulty of doing so in a totally manual way. As informações e dados estão atualmente concentradas em enorme quantidade dentro de arquivos de texto. E o fato da maior parte das informações tratadas por humanos estarem em textos não estruturados, justifica a importância de se extrair dados. O objetivo deste trabalho é desenvolver uma aplicação capaz de analisar e extrair informações úteis a partir de arquivos PDF. A aplicação irá utilizar uma ferramenta externa para converter PDF e realizar a extração do conteúdo em arquivo de texto. Logo em seguida irá efetuar uma busca por padrões, como endereços e datas. Finalmente fará o armazenamento dos dados tratados em um banco de dados NoSQL. Visto que a extração de informação em arquivos PDF gera uma grande quantidade de dados, surge a necessidade de apoio automatizado ao usuário, devido dificuldade de se realizar isso de forma totalmente manual. 2020-11-19T21:06:10Z 2020-11-19T21:06:10Z 2018-05-29 bachelorThesis XAVIER, Eduardo Semkiw; BATISTA, Jonathan da Silva. Criação de um banco de dados não relacional a partir de informação extraída de textos. 2018. 39 f. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018. http://repositorio.utfpr.edu.br/jspui/handle/1/16814 por openAccess application/pdf Universidade Tecnológica Federal do Paraná Ponta Grossa Brasil Departamento Acadêmico de Informática Tecnologia em Análise e Desenvolvimento de Sistemas UTFPR
institution	Universidade Tecnológica Federal do Paraná
collection	RIUT
language	Português
topic	Banco de dados não relacionais Processamento de textos (Computação) Análise de envoltória de dados Non-relational databases Text processing (Computer science) Data envelopment analysis CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
spellingShingle	Banco de dados não relacionais Processamento de textos (Computação) Análise de envoltória de dados Non-relational databases Text processing (Computer science) Data envelopment analysis CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Xavier, Eduardo Semkiw Batista, Jonathan da Silva Criação de um banco de dados não relacional a partir de informação extraída de textos
description	Information and data are currently concentrated in huge amounts within text files. And the fact that most information treated by humans is in unstructured texts justifies the importance of extracting data. The purpose of this paper is to develop an application capable of analyzing and extracting useful information from PDF files. The application will use an external tool to convert PDF and extract the content into text file. It will then search for patterns, such as addresses and dates. Finally, it will store the treated data in a NoSQL database. Since the extraction of information in PDF files generates a large amount of data, there is a need for automated support to the user, due to the difficulty of doing so in a totally manual way.
format	Trabalho de Conclusão de Curso (Graduação)
author	Xavier, Eduardo Semkiw Batista, Jonathan da Silva
author_sort	Xavier, Eduardo Semkiw
title	Criação de um banco de dados não relacional a partir de informação extraída de textos
title_short	Criação de um banco de dados não relacional a partir de informação extraída de textos
title_full	Criação de um banco de dados não relacional a partir de informação extraída de textos
title_fullStr	Criação de um banco de dados não relacional a partir de informação extraída de textos
title_full_unstemmed	Criação de um banco de dados não relacional a partir de informação extraída de textos
title_sort	criação de um banco de dados não relacional a partir de informação extraída de textos
publisher	Universidade Tecnológica Federal do Paraná
publishDate	2020
citation	XAVIER, Eduardo Semkiw; BATISTA, Jonathan da Silva. Criação de um banco de dados não relacional a partir de informação extraída de textos. 2018. 39 f. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.
url	http://repositorio.utfpr.edu.br/jspui/handle/1/16814
_version_	1805296405373255680
score	10,814766

Criação de um banco de dados não relacional a partir de informação extraída de textos

Registros relacionados