viernes, 28 de agosto de 2009

Memoria Clase 5

24 de agosto de 2009

Introducción a la Recuperación de Información

Uno de los sistemas de recuperación de información está determinado por la indización también conocido en entornos informáticos como indexación. Éste procedimiento está dado por el uso adecuado de la información y por la recuperación de los términos que éste contiene, con el fin de permitir una captura adecuada, exacta y más próxima a las necesidades del usuario. Lo que busca la indización es crear tablas o listas que permitan generar los términos que están contenidos en secuencia taxonómica para realizar búsquedas de comparación, similitud o en tal caso con el uso de operadores que permitan tener más exactitud en el resultado.

Véase: El diccionario electrónico: un instrumento para la unificación de términos en la indización automática

Ahora bien una vez realizada la indización de un sistema se puede estructurar los sets o los criterios que se desean determinar para recuperar la información, algunos conocidos como palabras claves, descriptores, lenguajes documentales, números de clasificación o encabezamientos de materia todo relacionado con el lenguaje controlado y normalizado.

Otro método para el sistema de recuperación de información es el conocido como archivo invertido, definido como “Archivo auxiliar de una base de datos o de un catálogo, que se organiza por alguno de los elementos o características contenidas en los registros de la base principal (por ej., descriptor, autor, etc.), y remite a los registros que la incluyen. Es especialmente apto para facilitar un mínimo control terminológico en sistemas por lenguaje natural.” Los archivos invertidos se componen de un vocabulario conformado por la cantidad de términos recuperados como índices y de ocurrencias basadas en la proximidad y similitud de las búsquedas.

No hay comentarios:

Publicar un comentario