FGV Repositório Digital
    • português (Brasil)
    • English
    • español
      Acesse:
    • FGV Biblioteca Digital
    • FGV Periódicos científicos e revistas
  • português (Brasil) 
    • português (Brasil)
    • English
    • español
  • Entrar
Ver item 
  •   Página inicial
  • Produção Intelectual em Bases Externas
  • Documentos Indexados pela Web of Science
  • Ver item
  •   Página inicial
  • Produção Intelectual em Bases Externas
  • Documentos Indexados pela Web of Science
  • Ver item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Navegar

Todo o repositórioComunidades FGVAutorOrientadorAssuntoTítuloDataPalavra-chaveEsta coleçãoAutorOrientadorAssuntoTítuloDataPalavra-chave

Minha conta

EntrarCadastro

Estatísticas

Ver as estatísticas de uso

Training state-of-the-art portuguese POS taggers without handcrafted features

Thumbnail
Visualizar/Abrir
000358252900008.pdf (257.0Kb)
Data
2014
Autor
Santos, Cicero Nogueira dos
Zadrozny, Bianca
Metadados
Mostrar registro completo
Resumo
Part-of-speech (POS) tagging for morphologically rich languages normally requires the use of handcrafted features that encapsulate clues about the language's morphology. In this work, we tackle Portuguese POS tagging using a deep neural network that employs a convolutional layer to learn character-level representation of words. We apply the network to three different corpora: the original Mac-Morpho corpus; a revised version of the Mac-Morpho corpus; and the Tycho Brahe corpus. Using the proposed approach, while avoiding the use of any handcrafted feature, we produce state-of-the-art POS taggers for the three corpora: 97.47% accuracy on the Mac-Morpho corpus; 97.31% accuracy on the revised Mac-Morpho corpus; and 97.17% accuracy on the Tycho Brahe corpus. These results represent an error reduction of 12.2%, 23.6% and 15.8%, respectively, on the best previous known result for each corpus.
URI
http://hdl.handle.net/10438/23485
Coleções
  • Documentos Indexados pela Web of Science [875]
Áreas do conhecimento
Tecnologia
Assunto
Língua portuguesa
Redes sociais
Palavra-chave
Portuguese part-of-speech tagging
Deep learning
Convolutional neural networks
Recognition

DSpace software copyright © 2002-2016  DuraSpace
Entre em contato | Deixe sua opinião
Theme by 
@mire NV
 

 


DSpace software copyright © 2002-2016  DuraSpace
Entre em contato | Deixe sua opinião
Theme by 
@mire NV
 

 

Importar metadado