Registro fonte: Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional

Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional

Videos are one of the most popular contents on the internet, social medias platforms and cell phone’s made capture and publish videos so easy and fast. However, in a lot of cases it’s necessary edit the content manually, which is irksome, because it takes a lot of time. Therefore, the need automatic...

ver descrição completa

Autor principal:	Caveion, Thallia
Formato:	Trabalho de Conclusão de Curso (Graduação)
Idioma:	Português
Publicado em:	Universidade Tecnológica Federal do Paraná 2023
Assuntos:	Redes neurais (Computação) Gravação em vídeo Edição de dados Neural networks (Computer science) Video recording Data editing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Acesso em linha:	http://repositorio.utfpr.edu.br/jspui/handle/1/30618
Tags:	Adicionar Tag Sem tags, seja o primeiro a adicionar uma tag!

id	riut-1-30618
recordtype	dspace
spelling	riut-1-306182023-02-24T06:07:04Z Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional Classification of video segments by speech snippets using convolutional neural network Caveion, Thallia Rodrigues, Érick Oliveira Oliva, Jefferson Tales Rodrigues, Érick Oliveira Oliva, Jefferson Tales Ascari, Rúbia Eliza de Oliveira Schultz Redes neurais (Computação) Gravação em vídeo Edição de dados Neural networks (Computer science) Video recording Data editing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Videos are one of the most popular contents on the internet, social medias platforms and cell phone’s made capture and publish videos so easy and fast. However, in a lot of cases it’s necessary edit the content manually, which is irksome, because it takes a lot of time. Therefore, the need automatic editing alternative. In this final paper presents a creation proposal of video classification model, using convolutional neural networks. Starts with several self-authored videos, which each one was randomly cut in different parts. From these parts, there were took the audios in wav (waveform audio format), previously classified and after extracted the characteristics of each file using the Mel frequency cepstrum coefficients method (MFCC), it was got spectrograms as like 2D images. Those spectrograms start the convolutional neural networks implemented producing as output, a classification model. Experimental results from the methodology proposed, showed that this model it’s able to classify 92,52% of videos stretches correctly. Vídeos são uma das formas mais populares de conteúdo na Internet, Plataformas de mídia social e telefones celulares tornaram simples e rápido capturar e publicar vídeos. No entanto, em diversos casos se faz necessário a edição manual desse tipo de conteúdo, a qual é considerada custosa, pois demanda muito tempo. Portanto, a necessidade de uma alternativa de edição automática. Neste trabalho, foi proposto um modelo de classificação de trechos de vídeo utilizando rede neural convolucional. A entrada é composta por diversos vídeos de autoria própria que foram cortados de forma aleatória em diversos trechos. Destes trechos foram extraídos os áudios obtendo arquivos no formato wav (waveform audio file format) que foram previamente classificados. Posteriormente, são extraídas características de cada arquivo utilizando o método coeficientes cepstrais de frequência de Mel (MFCC), obtendo assim espectrogramas equivalentes a imagens 2D. Estes espectrogramas servem como entrada para a rede neural convolucional ao qual gera como saída um modelo de classificação. Resultados experimentais da metodologia proposta mostraram que o modelo é capaz de classificar 92,52% dos trechos de forma correta. 2023-02-23T14:18:03Z 2023-02-23T14:18:03Z 2022-12-05 bachelorThesis CAVEION, Thallia. Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2022. http://repositorio.utfpr.edu.br/jspui/handle/1/30618 por openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ application/pdf Universidade Tecnológica Federal do Paraná Pato Branco Brasil Departamento Acadêmico de Informática Engenharia de Computação UTFPR
institution	Universidade Tecnológica Federal do Paraná
collection	RIUT
language	Português
topic	Redes neurais (Computação) Gravação em vídeo Edição de dados Neural networks (Computer science) Video recording Data editing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
spellingShingle	Redes neurais (Computação) Gravação em vídeo Edição de dados Neural networks (Computer science) Video recording Data editing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Caveion, Thallia Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
description	Videos are one of the most popular contents on the internet, social medias platforms and cell phone’s made capture and publish videos so easy and fast. However, in a lot of cases it’s necessary edit the content manually, which is irksome, because it takes a lot of time. Therefore, the need automatic editing alternative. In this final paper presents a creation proposal of video classification model, using convolutional neural networks. Starts with several self-authored videos, which each one was randomly cut in different parts. From these parts, there were took the audios in wav (waveform audio format), previously classified and after extracted the characteristics of each file using the Mel frequency cepstrum coefficients method (MFCC), it was got spectrograms as like 2D images. Those spectrograms start the convolutional neural networks implemented producing as output, a classification model. Experimental results from the methodology proposed, showed that this model it’s able to classify 92,52% of videos stretches correctly.
format	Trabalho de Conclusão de Curso (Graduação)
author	Caveion, Thallia
author_sort	Caveion, Thallia
title	Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
title_short	Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
title_full	Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
title_fullStr	Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
title_full_unstemmed	Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
title_sort	classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional
publisher	Universidade Tecnológica Federal do Paraná
publishDate	2023
citation	CAVEION, Thallia. Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2022.
url	http://repositorio.utfpr.edu.br/jspui/handle/1/30618
_version_	1805452968731869184
score	10,814766

Classificação de segmentos de vídeos por trechos de fala utilizando rede neural convolucional

Registros relacionados