La
teoría de recuperación de información es una especialidad académica con una
(relativamente) larga tradición en Estados Unidos, donde se cultiva en las
universidades y los laboratorios por lo menos desde los años 60.
Conceptualmente, la recuperación de
información (RI en adelante) es una operación que consiste en la interpretación
de una necesidad de información con el fin de seleccionar los documentos más
relevantes capaces de solucionarla.
Sin embargo, esta aparente sencillez
conceptual encierra diversos problemas cognitivos que distan mucho de ser
sencillos, a saber:
- identificar y representar necesidades de información.
- identificar y representar el conocimiento contenido en documentos.
- seleccionar los documentos más relevantes de acuerdo con los dos problemas anteriores.
- mostrarlos al usuario.
Fundamentos
de recuperación de información.
Según el modelo más aceptado actualmente,
la recuperación de información consiste en un proceso en el que intervienen
tres elementos:
- Una colección de ítemes de información, tales como documentos, que están registrados en un depósito de información (por ejemplo en una base de datos).
- Una serie de preguntas que traducen las necesidades de información de los usuarios y, finalmente.
- Una función de comparación documentos/preguntas que genera como salida documentos relevantes. Recuperar información, entonces consiste en buscar los documentos que exhiben un mayor parecido con la pregunta.
La hipótesis subyacente en el modelo
anterior es que una forma de juzgar la relevancia de un documento es medir su
grado de similitud con la pregunta, y que la forma de representar ambas
entidades (preguntas y documentos) es mediante el uso de información textual,
aunque las entidades en sí mismas no sean textuales.
En general, para comparar el grado de
parecido entre dos entidades es necesario identificar algún grupo de
propiedades medibles y después establecer un procedimiento que permita calcular
cuántas de éstas propiedades comparte ambas entidades.
No hay comentarios:
Publicar un comentario