lunes, 7 de septiembre de 2009

Memoria Clase 8


04 de Septiembre de 2009

EXTRACCION DE INFORMACION


La definición de necesidad de información se identifica como un hueco que se tiene de la información y se debe rellenar con información. Existen dos clases de necesidad de información, para Frans & Brush (1988):

1) CIN Necesidad de Información concreta, en la cual la necesidad es, por ejemplo, un dato exacto, fecha de nacimiento de xx. A pregunta concreta respuesta concreta. Al realizar esta búsqueda tan específica no se encuentra la respuesta específica, la mayoría de veces la respuesta concreta se encuentra dentro de un documento.

2) NIOP Necesidad de información orientada al objeto, para la satisfacción de esta necesidad se debe tener en cuenta hasta qué punto se cubre esta necesidad de información y que la necesidad cambia con el tiempo, total de población en Colombia, cada día nacen y mueren personas.

Existen muchas definiciones de Recuperación de información, entre los que encontramos a

INGWERSEN: para quien la RI es un problema de espacios conceptuales, eso es un problema de gestión de conocimiento. Es el paso de un estado actual al estado necesario, tomado éste último como llenar espacios conceptuales.

BELKIN: Estado anormal de conocimiento que manifiesta carencia informacional y problema de estructuras mentales.

Para RICARDO BAEZA-YATEZ (quien es vicepresidente de investigación para Europa y Amèrica Larina de Yahoo Research, Sus intereses de investigación incluyen algoritmos y estructuras de datos, recuperación de información, minería de la Web, bases de datos de texto e imágenes, y visualización de software y bases de datos. (Información tomada de: http://www.dcc.uchile.cl/~rbaeza/spanish.html) La RI es un conjunto, tarea, procesos, mediante el cual un usuario localiza y accede a recursos, información RELEVANTE (importancia pertinente al usuario) que le ayudan a resolver su problema informacional.

En la RI por encontrase demasiada información es importante y se debe indizar. La máquina que es el medio por el cual se realiza la búsqueda establece unos niveles de RELEVANCIA (importancia del documento – orden de importancia)
También se puede entender como tareas y procesos mediante los cuales el usuario localiza y accede a recursos de información RELEVANTE, los cuales eliminan información inútil y permite reducir el estado anómalo del conocimiento.

La recuperación de información no es encontrar patrones

La extracción de información es la búsqueda de información donde no importa el orden de los resultados sino seguir unas reglas predeterminadas y encontrar documentos que cumplan con esas reglas. Ejemplo SPAM, se puede direccionar correos que contengan ciertas palabras o frases a SPAM, (correos que su contenido sea sexo, viagra, digite su cuenta, etc)

La recuperación de información se hace de una colección de documentos: la acción es recuperar los documentos RELEVANTES (que cumplan reglas lógicas) EXTRAER este documento que cumplan las reglas, separarlos y así obtener una serie de documentos EXTRAIDOS.

No hay comentarios:

Publicar un comentario