Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR
The necessity of storing evergrowing media in terms of storage size and complexity is a tendency that grew considerably with technology and comunication advances. These data known as complex data demand a much bigger structural storage and analysis complexity when compared with simple data such as w...
Autor principal: | Matsui, Cristiano José Mendes |
---|---|
Formato: | Trabalho de Conclusão de Curso (Graduação) |
Idioma: | Português |
Publicado em: |
Universidade Tecnológica Federal do Paraná
2020
|
Assuntos: | |
Acesso em linha: |
http://repositorio.utfpr.edu.br/jspui/handle/1/14606 |
Tags: |
Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
|
id |
riut-1-14606 |
---|---|
recordtype |
dspace |
spelling |
riut-1-146062020-11-18T14:01:39Z Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR Similarity queries in complex databases using OMNI technique in RDBMS Matsui, Cristiano José Mendes Pola, Ives Renê Venturini Pola, Fernanda Paula Barbosa Pola, Ives Renê Venturini Pola, Fernanda Paula Barbosa Casanova, Dalcimar Cavalcanti, Pablo Gautério Banco de dados Sistemas de consultas e respostas Otimização matemática Data bases Question-answering systems Mathematical optimization CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO The necessity of storing evergrowing media in terms of storage size and complexity is a tendency that grew considerably with technology and comunication advances. These data known as complex data demand a much bigger structural storage and analysis complexity when compared with simple data such as words or numbers, besides requiring special queries operators, like Range query (Rq) and k-Nearest Neighbors query (kNNq). Among the complex data set the images are highlighted, which need to be compared using extracted features such as color, shape or texture. This comparison is done by distance calculations between the feature value of the central image of the query in relation to all the remaining images in the database. Query time increases significantly with the increase of database size and complexity. To work around the curse of dimensionality problem, this study proposes the application of the OMNI technique, used to promote a filtering step of the number of images to have their distances calculated, avoiding comparing with the entire database. This technique has additional storage costs for its structures, but can accelerate similarity queries, reducing required execution time. A necessidade de armazenamento de mídias cada vez maiores em termos de tamanho de armazenamento e complexas é uma tendência que aumentou consideravelmente com os avanços da tecnologia e comunicação. Estes dados conhecidos como dados complexos exigem uma complexidade estrutural de armazenamento e análise maior do que dados simples como palavras ou números, além de requererem operadores especiais de consultas, como a consulta por abrangência - range query (Rq) e a consulta aos k-vizinhos mais próximos - k-nearest neighbors query (kNNq). Dentre o conjunto de dados complexos destacam-se as imagens, que precisam ser comparadas de acordo com características extraídas como cor, forma ou textura. Esta comparação é realizada na forma de um cálculo de distância entre o valor da característica da imagem central da consulta em relação a todas as outras imagens da base de dados. O tempo de consulta aumenta significativamente com o aumento da base de dados e da complexidade destes. Para contornar o problema da maldição da dimensionalidade, este trabalho tem como proposta a aplicação da técnica OMNI utilizada para promover uma etapa de filtragem do número de imagens a terem as suas distâncias calculadas, evitando a comparação com toda a base de dados. Esta técnica possui custos adicionais de espaço de armazenamento para as suas estruturas, mas consegue acelerar consultas por similaridade, reduzindo o tempo de execução necessário. 2020-11-18T14:01:39Z 2020-11-18T14:01:39Z 2018-12-06 bachelorThesis MATSUI, Cristiano José Mendes. Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR. 2018. 50 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018. http://repositorio.utfpr.edu.br/jspui/handle/1/14606 por openAccess 2019-12-15 application/pdf Universidade Tecnológica Federal do Paraná Pato Branco Brasil Departamento Acadêmico de Informática Engenharia de Computação UTFPR |
institution |
Universidade Tecnológica Federal do Paraná |
collection |
RIUT |
language |
Português |
topic |
Banco de dados Sistemas de consultas e respostas Otimização matemática Data bases Question-answering systems Mathematical optimization CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
spellingShingle |
Banco de dados Sistemas de consultas e respostas Otimização matemática Data bases Question-answering systems Mathematical optimization CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Matsui, Cristiano José Mendes Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR |
description |
The necessity of storing evergrowing media in terms of storage size and complexity is a tendency that grew considerably with technology and comunication advances. These data known as complex data demand a much bigger structural storage and analysis complexity when compared with simple data such as words or numbers, besides requiring special queries operators, like Range query (Rq) and k-Nearest Neighbors query (kNNq). Among the complex data set the images are highlighted, which need to be compared using extracted features such as color, shape or texture. This comparison is done by distance calculations between the feature value of the central image of the query in relation to all the remaining images in the database. Query time increases significantly with the increase of database size and complexity. To work around the curse of dimensionality problem, this study proposes the application of the OMNI technique, used to promote a filtering step of the number of images to have their distances calculated, avoiding comparing with the entire database. This technique has additional storage costs for its structures, but can accelerate similarity queries, reducing required execution time. |
format |
Trabalho de Conclusão de Curso (Graduação) |
author |
Matsui, Cristiano José Mendes |
author_sort |
Matsui, Cristiano José Mendes |
title |
Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR |
title_short |
Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR |
title_full |
Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR |
title_fullStr |
Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR |
title_full_unstemmed |
Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR |
title_sort |
consultas por similaridade em bases de dados complexos utilizando técnica omni em sgbdr |
publisher |
Universidade Tecnológica Federal do Paraná |
publishDate |
2020 |
citation |
MATSUI, Cristiano José Mendes. Consultas por similaridade em bases de dados complexos utilizando técnica OMNI em SGBDR. 2018. 50 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/14606 |
_version_ |
1805325465853886464 |
score |
10,814766 |