Hipercubo Darwin - La Web Semántica

Metodología Aiware - X

Juan Chamero, Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo. , al 24 de Abril del 2013

Apéndices

  

En la figura se esquematiza el “Hipercubo Darwin” que sería el “esqueleto lógico” de la Web ordenada semánticamente. El actual contenido Web no está ordenado temáticamente sino por palabras, es decir los hoy 30.000 millones de páginas Web no están ordenados por tema, lo que se define como contenido no-estructurado o “plano” cual si todos pertenecieran a un único tema. Para transformar a la Web en semántica es preciso definir para cada uno de sus documentos el tema al cual pertenecen, una muy pesada tarea “bibliotecológica” que implicaría clasificar a esa enorme masa de documentos por tema en no menos de 13 niveles del Conocimiento Humano. El Hipercubo Darwin estaría pues representando esos 13 niveles. A la derecha se presenta lo que se conoce como “semantic fingerprint” o perfil semántico de un documento dado y que forma parte de lo que se conoce como “metadata”, o sea lo que define la estructura y habla sobre los datos del documento. Veremos a continuación cómo ordena Darwin a uno de sus agentes que busque documentos “similares” a uno dado, en el supuesto que estemos en presencia de una Web semántica, indexada por tema.

 

Operadores y Lenguaje natural Darwin

A fin de dar una idea acerca de cómo se programan los pasos en la Metodología Darwin, de la cual la Metodología Aiware deriva compartiendo su misma ontología, presentamos como muestra uno de sus “Operadores” editados en una especie de Lenguaje Natural propio de Darwin:

Nota 05: La Metodología Darwin aplicada a la creación de Mapas de Conocimiento Humano comprende un complejo proceso seriado de 82 pasos siendo cada uno de ellos activado por un Operador como el que pasamos a describir. Aplicada a casos de menor complejidad y volumen tales como la realización de IdeI’s, Informes de Inteligencia, el proceso comprende menor cantidad de pasos.

Fetch similar Operator: por Operador de Búsqueda de Similares es un operador que busca documentos similares a uno dado (d). La similitud es desde el punto de vista semántico, es decir compartiendo idealmente sus mismos “conceptos” o como mínimo un perfil semántico común.

F2 ({SE’s}, n, similarity ratio, calculation time (t)); (d),

Para ello un agente es instruido a buscar dentro de los resultados de una búsqueda realizada sobre un “pool” de buscadores ({SE’s} o motores de búsqueda (SE’s por “Search Engines”), con una consulta que aquí no es mostrada, comenzando por las referencias Top de la misma.

Este operador hace uso de un “Algoritmo Markoviano”, ya descrito en varios artículos de este sitio, para pasar de una referencia a otra buscando documentos “similares”. Son exactamente similares aquellos documentos que comparten con el documento (d) lo que la Ontología Darwin denomina el mismo “Fingerprint” o “huella digital semántica” de un documento, un conjunto de pares (k, f): keyword - frecuencia de aparición para cada una de las keywords que aparecen en el documento en cuestión. Este operador “bucea” dentro de los resultados entregados por el “pool” documento por documento a través de operadores menores del tipo GET que traen muestras de a (n) documentos.

Si llega un momento en el que la cantidad de documentos de la muestra fuera menor que (n) el agente entenderá que hay que ser menos riguroso en la búsqueda de similitud  exacta, pasando a similitudes de menor grado, por ejemplo eliminando del “fingerprint” un par (k, f) tomado al azar. Esta parte del proceso es controlada por un coeficiente de similitud “similarity ratio” definido con valores entre 0 y 1: cuanto más alejado de 1, por ejemplo definido como igual a 0,7, más débil será la similitud. La única limitación de este proceso es el tiempo de ejecución del mismo (t) que puede ser acotado.

Nota del Webmaster: Estos operadores son muy poderosos facilitando la programación de sistemas de alta complejidad. Darwin crea un lenguaje natural del tipo del “viejo” APL, por “A Programming Language” o lenguaje lógico algebraico de Kenneth E. Iverson. Este lenguaje lanzado a mediados de la década del 60 del siglo pasado fue demasiado avanzado para su época, fundamentalmente por lo conciso y compacto. Su uso debería ser reconsiderado pues permite manejar con elegancia y precisión enormes arreglos como los que hay que manejar en las aplicaciones de Semántica Web.

 

Additional information