SciELO - Scientific Electronic Library Online

 
 número34Descubrimiento de Conocimiento en Historias Clínicas mediante Minería de TextoPlanificación estática para la transmisión de datos en tiempo real con WSN índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação

versão impressa ISSN 1646-9895

Resumo

ACOSTA, Rubén Sánchez; VILLEGAS, Claudio Meneses  e  NORAMBUENA, Brian Keith. Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos. RISTI [online]. 2019, n.34, pp.44-53. ISSN 1646-9895.  http://dx.doi.org/10.17013/risti.34.44-53.

Las técnicas de data augmentation son esenciales para entrenar algoritmos de machine learning, donde el conjunto de datos inicial es más pequeño que lo requerido debido a la complejidad del modelo. En modelos de aprendizaje automático, la robustez del proceso de entrenamiento depende altamente de grandes volúmenes de datos etiquetados, los cuales son costosos de producir. Un enfoque eficaz para tratar con este problema es generar automáticamente nuevos ejemplos etiquetados usando técnicas de data augmentation. En el procesamiento del lenguaje natural, en particular en el idioma español, hay una falta de técnicas bien definidas que permitan incrementar un conjunto de datos. En este artículo, se proponen un conjunto de heurísticas para data augmentation en NLP, las cuales son aplicadas en el dominio de las revisiones de artículos científicos.

Palavras-chave : Data Augmentation; NLP; Revisiones de Artículos.

        · resumo em Inglês     · texto em Espanhol     · Espanhol ( pdf )

 

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons