SciELO - Scientific Electronic Library Online

 
vol.12 número48Modelo genérico de celdas fotovoltaicasImplementación de filtros morfológicos utilizados en el procesamiento de imágenes digitales en un dispositivo lógico programable índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Universidad, Ciencia y Tecnología

versión impresa ISSN 1316-4821versión On-line ISSN 2542-3401

Resumen

ARTIGAS FUENTES, Fernando; GIL GARCIA, Reynaldo; BADIA CONTELLES, José Manuel  y  PONS PORRATA, Aurora. Cálculo de la vecindad mediante grafos en minería de textos. uct [online]. 2008, vol.12, n.48, pp.163-170. ISSN 1316-4821.

La búsqueda de los documentos más semejantes a uno dado es fundamental en la Minería de Textos, pues es el procedimiento básico de muchas técnicas como la clasificación o la recuperación de información. Los documentos suelen representarse en un espacio de rasgos de alta dimensionalidad, donde cada término que ocurre en el documento se trata como un rasgo y el peso de cada término refleja su importancia en el documento. Existen multitud de técnicas para buscar la vecindad de un objeto, pero disminuyen drásticamente sus prestaciones a medida que crecen las dimensiones. Este problema imposibilita su aplicación al caso de los documentos. En este artículo se presenta un método de acceso basado en una estructura de grafo que determina de forma aproximada la vecindad de un nuevo documento. El método obtenido presenta una selectividad alta y una tasa de error aceptable cuando se usa embebido en un clasificador, comparándolo con el método exhaustivo que evalúa el 100% de los documentos. Como resultado del estudio se concluye que es factible el uso del método propuesto en problemas de muy alta dimensionalidad, como es el caso de la Minería de Textos.

Palabras clave : Minería de datos; Minería de textos; Métodos de acceso; Indexado en muy alta dimensionalidad; Cálculo de la vecindad.

        · resumen en Inglés     · texto en Español

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons