Búsqueda Inteligente

Búsqueda y Buscadores

 

La Metodología Darwin es especialmente apta para la creación de nuevos buscadores, globales o especializados y/o potenciación de buscadores existentes. Una posibilidad es por ejemplo la creación de “Gafas Semánticas” Darwin para ver más y mejor toda la Web o regiones de ella, Estas gafas se concretan en una interface inteligente o “chip virtual” que puede ubicarse en una computadora personal o en un teléfono inteligente.

Buscadores especiales: generalmente asociados a grandes bases de datos públicas en ciencia y tecnología, georeferenciales, biológicas, literarias, hemerotecas, etc. Sea cual sea la temática a la que deseemos asociar un buscador inspeccionemos antes lo existente y público en la Web. La mayor parte de los buscadores asociados a éstas bases públicas pre existentes son del tipo “de la A a la Z”, por tema o keyword. Por otra parte por ser sus contenidos altamente especializados sus keywords son de hecho conceptos, es decir, muchas de estas bases está semánticamente estructuradas necesitando a lo sumo un “aggiornamento” de sus términos.

La imagen: Si usted consulta al motor Google de Imágenes por “Garfield pictures” le aparecerán miles de imágenes y de plantillas de íconos del universalmente simpático y famoso personaje de ficción Garfield como la que aparece abajo. Lo mismo ocurre para otros personajes similares y sus avatares tales como Los Simpson (ver nuestra sección dedicada a Patrones de Conducta), o la de nuestra muy querida Mafalda preguntando al mismo motor por “mafalda avatars”.  

 

 

El disponer de motores de búsqueda para pequeñas colecciones es atractivo pero no esencial. Lo incluimos porque hay una marcada tendencia a crearlos dentro del mundo de las imágenes.  Iremos presentando algunas soluciones de búsqueda Web de lo más elemental a lo más complejo y de lo particular a lo general.

Búsquedas en Contenido Semánticamente Estructurado: o sea un contenido estructurado en función de su significado conceptual. Veamos esto con un ejemplo de buscador realizado por nosotros para un portal latinoamericano hace ya más de 10 años y que mantiene su vigencia. En la figura de abajo se muestra la “Caja de Búsqueda Semántica” construida para un “Yellow Pages”, por Buscador de Páginas Amarillas, idealmente un catálogo estructurado en varias dimensiones que para el caso eran dos: Por Actividad socio económico cultural y por Zona Geográfica.

 

Las actividades socio económico culturales eran unas 2.000 estructuradas jerárquicamente, en este caso en tres niveles (en aplicaciones más complejas existen hasta 13 niveles pero todo se reduce a poner 13 cajitas en lugar de 3). El espacio geográfico es organizado también en tres niveles (podría ser hasta en seis o siete como las bases de datos georeferenciales). Para cada una de sus dos dimensiones el usuario puede focalizar su búsqueda mediante el agregado de “keywords adicionales”, en este caso solo una por dimensión pero su número podría ser cualquiera que dé lugar a una discriminación razonable. Finalmente, la cantidad de dimensiones podrían ser tantas como sean necesarias. Además la navegación por cada una de las dimensiones puede potenciarse usando servicios existentes tales como el de “Google Map”.

La caja se habilitó para hacer búsquedas en forma completa o resumida y usando uno o varios motores de búsqueda. Para el ejemplo hemos habilitado al agente para que use como buscador a Google. Abajo se muestran los resultados para la consulta:

 

 

Búsquedas más complejas: la complejidad surge fundamentalmente por problemas de volumen y de  de falta de estructuración del contenido. Tomemos como ejemplo la construcción de un buscador universal de Arte en el Mundo. La cantidad de categorías es del orden de 7.500 estructuradas en forma arbórea en 13 niveles. Ustedes pensarán que de estar el contenido del arte en la Web bien estructurado usar como buscador - navegador una caja como la recientemente descrita sería una buena decisión: puede ser, sin embargo si las búsquedas globales para satisfacer absolutamente cualquier demanda en cualquier grado de profundidad y especificidad obligan a pensar no solo en esas 7.500 categorías sino en cómo acceder a los casi 350.000 conceptos que acuña el arte la búsqueda podría convertirse en una aventura de resultado incierto.

 

Estos 350.000 conceptos del arte están distribuidos sobre el andamiaje lógico de las 7.500 categorías a razón de unos 45 conceptos por categoría en promedio. Llevado a nuestro ejemplo de Páginas Amarillas sería abrir el nodo del ejemplo ["arte+y+cultura"+"artes+plasticas"+"pintura"] para todos los posibles estilos de pintura. Si quisiéramos un buscador preciso, amigable y ágil para este tipo de búsqueda, que entraría de hecho en la categoría de “buscadores semánticos”, nos veríamos obligados a buscar soluciones más inteligentes.

 

Buscadores semánticos: Para este tipo de buscadores Darwin propone diálogos usuario - agente (hombre - máquina) en los que el agente,  actuando como súper bibliotecario, va “construyendo la imagen mental” que el usuario tiene “in mente”. Sea el caso encontrar información sobre las últimas presentaciones de la Ópera Rigoletto en Europa el usuario en forma lacónica solo interroga por “Rigoletto”. El agente intenta explicarle que ese término es ambiguo pues existen en la Web referencias del más diverso tipo relacionadas con esa palabra, desde pizzerías a academias de baile y de arte culinario hasta métodos de aprendizaje y al efecto de guiarlo le presenta una listado de esas referencias. En uno a dos pasos más de diálogo, usuario y agente acuerdan buscar por Rigoletto Ópera. En uno a dos pasos extra el agente arriba a la conclusión de que el usuario solo está interesado en “presentaciones recientes” de dicha obra musical y particularmente en Europa. Finalmente, el usuario hace su primer clic y otro agente de recuperación de información en buscadores convencionales (distinto al agente súper bibliotecario) le acerca unas pocas pero atinentes referencias todas relacionadas con la consulta, entre ellas la siguiente de “EuropaPress.com” para la comunidad de Andalucía - España: http://www.europapress.es/andalucia/cultura-00621/noticia-foro-acoge-martes-opera-rigoletto-mano-compania-concerlirica-20120806175703.html.

La búsqueda es solo el principio: Los buscadores convencionales nos permiten encontrar, a la corta o a la larga, lo que buscamos. Y hay que reconocer que han progresado tanto que generalmente encontramos a través de ellos lo que buscamos en muy pocos clics y difícilmente demorando más de una hora si el tema es algo raro y/o complejo. No obstante los casos raros y/o complejos no son tan pocos ni tan infrecuentes. Evidentemente si estamos navegando en tren de divertirnos no nos preocupa demasiado no encontrar lo que buscamos pues esto no está muy definido, es a lo sumo un “quisiera ver algo de tal o cual cosa”. Luego, si el buscador, con la “complicidad” del navegador y a la larga nuestra aquiescencia nos conduce por otras regiones solemos, en la mayoría de los casos,  aceptar las sugerencias. Si por el contrario, estamos abocados a buscar algo realmente importante y en grado de detalle operativo, no solo para estar informados o para entretenernos, la distracción se convierte en onerosa pérdida de tiempo que puede llegar a ser muy significativa. Efectivamente ha sido comprobado que no es tarea simple encontrar lo que uno necesita a nivel profesional o académico usando los buscadores convencionales pudiendo demorar de días a semanas y muchas veces debemos resignarnos a buscar por otro medio.

Una solución radical a este problema es, como hemos visto, la búsqueda a través de buscadores semánticos de un único clic, que puede demorar en el peor de los casos de uno a dos minutos de diálogo y reflexión. Ahora deberíamos preguntarnos: eso resuelve totalmente el problema?. La respuesta es No. A partir de la entrega de las referencias a documentos (páginas Web) dentro de los cuales estaría la solución a nuestra inquietud, deberíamos proceder a leerlos. Nos preguntamos: pueden los agentes Darwin seguir ayudándonos?: la respuesta es Sí, pueden. Los agentes Darwin han identificado la temática que mejor se adapta a la imagen mental de nuestra necesidad cognitiva y por lo tanto han identificado al conjunto de conceptos asociados a esa imagen mental. Lo que para ellos es cuestión de unos pocos milisegundos para nosotros humanos demandaría horas: los agentes Darwin pueden “leer” cada uno de los documentos Top señalando para cada uno de ellos contactos y usos con cada uno de los conceptos de la imagen mental capturada. Este primer análisis y/o mapeo de concordancia será de gran utilidad para el usuario humano. Si a su vez el usuario acuerda delegar y autorizar ciertas memorizaciones, a la larga permitiendo que los agentes Darwin “aprendan” de sus búsquedas, el proceso será cada vez más eficiente y preciso.

El efecto Google: La búsqueda se ha hecho tan imprescindible que para algunos investigadores sociales el no poder acceder a los buscadores por un cierto tiempo produce en la gente un gran desasosiego. Este efecto que debería haber sido nombrado como Efecto del Uso de Motores de Búsqueda nos dice que tendemos a olvidar aquella información que podemos encontrar fácilmente en la Web, por ejemplo a través de los buscadores. Uno de los primeros investigadores en describir el fenómeno fue la psicóloga Betsy Sparrow de la Universidad de Columbia en el artículo “Study finds that memory Works different in the Age of Google”, por  “La memoria trabaja diferente en la Era Google” (quizás de aquí, por extensión y “memética” surgió el nombre del efecto). Para la sicóloga Internet ofrece una memoria transactiva, término propuesto por el sicólogo Daniel Wegner, que sería la base de una mente grupal de conocimiento compartido tal como el que vamos acuñado los usuarios de Internet, especialmente en la Web y dentro de ella en los escenarios de las Redes Sociales.

A fin de de investigar el fenómeno se realizó el siguiente experimento con estudiantes de la Universidad de Columbia y de la Universidad de Harvard. En su parte uno los estudiantes debían responder a un cuestionario con preguntas triviales, algunas relacionadas al proceso de búsqueda en sí seguido por los colores de las palabras En la parte dos los estudiantes tenían que leer sentencias relacionadas a las preguntas tratando de recordar lo que habían leído. En general los estudiantes se sentían tranquilos con aquellas cosas que confiaban encontrar online. En la parte tres los estudiantes debían recordar detalles de las sentencias basados en si creían que podían encontrar información en cualquier lugar, en “algún” lugar específico o si no podían encontrarla en ningún lugar. Los estudiantes memorizaron la información que creían iban a olvidar más fácilmente. En la parte final fueron orientados a imaginar a las sentencias guardadas en carpetas personalizadas. Los estudiantes tendían a recordar más los nombres de las carpetas que los de las sentencias.

Una conclusión del estudio fue: la gente puede recordar algo si no sabe cómo encontrarlo y además puede pueden recordar cómo encontrar lo que necesitan si no pueden recordar la información. Otra conclusión: ante el exponencial crecimiento de información y conocimiento vamos a depender cada vez más de buscadores semánticos (de significados) y de mecanismos mnemónicos de búsqueda.

 Fuente: Transactive Memory, Evolución Acoplada de Comunicaciones y Conocimiento,

 

Additional information