domingo, 21 de junio de 2015

Recuperación de información inteligente.

    La teoría de recuperación de información es una especialidad académica con una (relativamente) larga tradición en Estados Unidos, donde se cultiva en las universidades y los laboratorios por lo menos desde los años 60.

    Conceptualmente, la recuperación de información (RI en adelante) es una operación que consiste en la interpretación de una necesidad de información con el fin de seleccionar los documentos más relevantes capaces de solucionarla.

    Sin embargo, esta aparente sencillez conceptual encierra diversos problemas cognitivos que distan mucho de ser sencillos, a saber:

  • identificar y representar necesidades de información.
  • identificar y representar el conocimiento contenido en documentos.
  • seleccionar los documentos más relevantes de acuerdo con los dos problemas anteriores.
  • mostrarlos al usuario.




Fundamentos de recuperación de información.

     Según el modelo más aceptado actualmente, la recuperación de información consiste en un proceso en el que intervienen tres elementos:

  • Una colección de ítemes de información, tales como documentos, que están registrados en un depósito de información (por ejemplo en una base de datos).
  • Una serie de preguntas que traducen las necesidades de información de los usuarios y, finalmente.
  • Una función de comparación documentos/preguntas que genera como salida documentos relevantes. Recuperar información, entonces consiste en buscar los documentos que exhiben un mayor parecido con la pregunta.

    La hipótesis subyacente en el modelo anterior es que una forma de juzgar la relevancia de un documento es medir su grado de similitud con la pregunta, y que la forma de representar ambas entidades (preguntas y documentos) es mediante el uso de información textual, aunque las entidades en sí mismas no sean textuales.


    En general, para comparar el grado de parecido entre dos entidades es necesario identificar algún grupo de propiedades medibles y después establecer un procedimiento que permita calcular cuántas de éstas propiedades comparte ambas entidades.


No hay comentarios:

Publicar un comentario