FGV Repositório Digital
    • português (Brasil)
    • English
    • español
      Acesse:
    • FGV Biblioteca Digital
    • FGV Periódicos científicos e revistas
  • português (Brasil) 
    • português (Brasil)
    • English
    • español
  • Entrar
Ver item 
  •   Página inicial
  • FGV EMAp - Escola de Matemática Aplicada
  • FGV EMAp - Dissertações, Mestrado em Modelagem Matemática
  • Ver item
  •   Página inicial
  • FGV EMAp - Escola de Matemática Aplicada
  • FGV EMAp - Dissertações, Mestrado em Modelagem Matemática
  • Ver item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Navegar

Todo o repositórioComunidades FGVAutorOrientadorAssuntoTítuloDataPalavra-chaveEsta coleçãoAutorOrientadorAssuntoTítuloDataPalavra-chave

Minha conta

EntrarCadastro

Estatísticas

Ver as estatísticas de uso

Transcrição, alinhamento e criação de legendas em uma base de História Oral

Thumbnail
Visualizar/Abrir
Dissertação (1.200Mb)
Data
2019-05-20
Autor
Alvarenga, Lucas Meireles Tomaz de
Orientador
Silva, Moacyr Alvim Horta Barbosa da
Metadados
Mostrar registro completo
Resumo
Dado a evolução da tecnologia relacionada a reconhecimento automáticode fala nos é permitido criar ferramentas que automatizem processos que somenteeram possíveis serem feitos por humanos, se o objetivo fosse ter uma boa qualidadeno resultado. Sendo assim, o objetivo desse trabalho é pesquisar a literatura emreconhecimento automático de fala e utilizar esse conhecimento para criar ferra-mentas que auxiliem o Centro de Pesquisa e Documentação de História Contem-porânea do Brasil (CPDOC) com o programa de História Oral. Além disso, espe-ramos que esse trabalho possa auxiliar outros centros que trabalhem com históriaoral, como por exemplo: Associação Internacional de História Oral (IOHA), RedeLatino-Americana de História Oral (RELAHO) e Associação brasileira de HistóriaOral (ABHO). Após um estudo sobre as principais técnicas na área de reconheci-mento automático de áudio, foi decidido utilizar um software proprietário para atranscrição automática da fala das entrevistas que populam o banco de dados deHistória Oral. Com a transcrição automática, utilizamos uma variação do algoritmode Needleman-Wunsch para alinharmos essa transcrição com a transcrição manualdas entrevistas, essas transcrições foram feitas por pessoas e não possuem o tempodas frases. Esse alinhamento possibilita a criação de legendas com um texto maiscorreto do que seria possível somente com a transcrição automática. Concluímos quetranscrições automáticas podem ser utilizadas no contexto de História Oral, que épossível alinhar textos utilizando o algoritmo de Needleman-Wunsch e dado essealinhamento é possível criar uma legenda, que a perda de sincronia entre o áudio eo texto não impossibilita o uso da mesma.
 
Given the evolution of technology related to automatic speech recognitionwe are able to create tools that automate processes that could only be done byhumans, if we wanted to have a good quality in the result. Therefore, the objectiveof this work is to research the literature about automatic speech recognition and usethis knowledge to create tools that support the Center for Research and Documenta-tion of Contemporary History of Brazil (CPDOC) with the Oral History project. Inaddition, we hope that this work can help other centers that work with oral history,such as: International Oral History Association (IOHA), Latin American Oral His-tory Network (RELAHO) and Brazilian Association of Oral History (ABHO). Afterthe study on the main techniques in the area of Automatic Speech Recognition, Itwas decided to use proprietary software to automatic transcribe the interviews thatpopulate the Oral History database. With the automatic transcription, we used avariation of the Needleman-Wunsch algorithm to align this transcription with amanual transcription, these transcriptions were made by human and do not havethe time of the sentences. This enable the creation of subtitles with a more correcttext than would be possible with automatic transcription alone. We conclude thatautomatic transcriptions can be used in the context of Oral History, that it is possi-ble to align texts using the Needleman-Wunsch algorithm and given this alignmentIt is possible to create a subtitle, that the loss of synchrony between the audio andthe text does not preclude the use of It.
 
URI
https://hdl.handle.net/10438/27683
Coleções
  • FGV EMAp - Dissertações, Mestrado em Modelagem Matemática [78]
Áreas do conhecimento
História
Assunto
Reconhecimento automático da voz
Modelagem de dados
História oral
Palavra-chave
Needleman-Wunsch
Deep Learning
Alinhamento
Recurrent Neural Network
Áudio para texto
História Oral

DSpace software copyright © 2002-2016  DuraSpace
Entre em contato | Deixe sua opinião
Theme by 
@mire NV
 

 


DSpace software copyright © 2002-2016  DuraSpace
Entre em contato | Deixe sua opinião
Theme by 
@mire NV
 

 

Importar metadado