skip to main content
Language:
Search Limited to: Search Limited to: Resource type Show Results with: Show Results with: Search type Index

Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta

Revista signos, 2020-12, Vol.53 (104), p.549 [Peer Reviewed Journal]

2020. This article is published under https://creativecommons.org/licenses/by-nc/4.0/deed.es (the “License”). Notwithstanding the ProQuest Terms and Conditions, you may use this content in accordance with the terms of the License. ;ISSN: 0035-0451 ;EISSN: 0718-0934 ;DOI: 10.4067/S0718-09342020000300549

Full text available

Citations Cited by
  • Title:
    Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
  • Author: Rodrigo Alfaro A. ; Héctor Allende O.
  • Subjects: Algorithms ; Classification ; Classifiers ; Natural language ; Text categorization
  • Is Part Of: Revista signos, 2020-12, Vol.53 (104), p.549
  • Description: La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional. La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este artículo el objetivo es evaluar un factor de ponderación de las palabras de los textos en el modelo booleano para representación de texto en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. Este factor de ponderación y la combinación de enfoques en la clasifiación automática fue puesto a prueba con cuatro diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.
  • Publisher: Valparaíso: Dr. Giovanni Parodi
  • Language: Spanish
  • Identifier: ISSN: 0035-0451
    EISSN: 0718-0934
    DOI: 10.4067/S0718-09342020000300549
  • Source: Alma/SFX Local Collection
    ProQuest Central

Searching Remote Databases, Please Wait