Aplicaciones de Aiware

Búsqueda Inteligente

Búsqueda y Buscadores

 

La Metodología Darwin es especialmente apta para la creación de nuevos buscadores, globales o especializados y/o potenciación de buscadores existentes. Una posibilidad es por ejemplo la creación de “Gafas Semánticas” Darwin para ver más y mejor toda la Web o regiones de ella, Estas gafas se concretan en una interface inteligente o “chip virtual” que puede ubicarse en una computadora personal o en un teléfono inteligente.

Buscadores especiales: generalmente asociados a grandes bases de datos públicas en ciencia y tecnología, georeferenciales, biológicas, literarias, hemerotecas, etc. Sea cual sea la temática a la que deseemos asociar un buscador inspeccionemos antes lo existente y público en la Web. La mayor parte de los buscadores asociados a éstas bases públicas pre existentes son del tipo “de la A a la Z”, por tema o keyword. Por otra parte por ser sus contenidos altamente especializados sus keywords son de hecho conceptos, es decir, muchas de estas bases está semánticamente estructuradas necesitando a lo sumo un “aggiornamento” de sus términos.

La imagen: Si usted consulta al motor Google de Imágenes por “Garfield pictures” le aparecerán miles de imágenes y de plantillas de íconos del universalmente simpático y famoso personaje de ficción Garfield como la que aparece abajo. Lo mismo ocurre para otros personajes similares y sus avatares tales como Los Simpson (ver nuestra sección dedicada a Patrones de Conducta), o la de nuestra muy querida Mafalda preguntando al mismo motor por “mafalda avatars”.  

 

 

Leer más.....

Informes de Inteligencia

Informes de Inteligencia

 

 

 

Qué muestra la figura: estos grafos han sido extraídos del artículo Competición de ideas en un Mundo de Atención Limitada, publicado por la prestigiosa científica “nature”. Este es un ejemplo de IdeI, Informe de Inteligencia, referido al tema “Cómo se difunden las ideas en la Web”, fundamentalmente a través de las redes sociales. Lo describiremos en mayor detalle pues se relaciona íntimamente con nuestra metodología Darwin.

La tesis del trabajo de investigación es que la atención de la gente, es decir la cuotaparte de interés de cada uno de nosotros como usuarios de Internet es limitada y hacia este vasto mercado global se dirige todo tipo de propuestas, básicamente “ideas” o más bien “ideas en formación” a las que ahora se denominan “memes” y “memética” a la ciencia que los estudia, por ejemplo slogans, marcas, frases, etc., destinados a captar el interés de la gente. 

Como universo práctico de lo que la gente opina o refleja acerca de los distintos memes que son continuamente lanzados a la Web los autores han elegido a la red Twitter y como marcadores a los “tweets” y retweets” (hoy por ejemplo la gente joven pasa gran parte de su tiempo libre “tweeteando” y “retweeteando”). La figura muestra el seguimiento de los siguientes memes:

 a) cómo se propagó la noticia del terremoto ocurrido en Japón en marzo del 2011;

b) cómo se propagaron los memes emitidos por el Partido Republicano de Estados Unidos;

c) cómo se propagaron memes relacionados con las Primavera Árabe del 2011 particularmente en Egipto y Siria;

 Análisis de resultados: La gente está representada por nodos y conectada entre sí por arcos direccionados por los retweets que se envían unos a otros. De estos grafos surgen aglomeraciones o “clusters”, constelaciones imaginarias y conexiones manifiestas entre clusters que deben ser analizadas por sociólogos, politólogos y expertos en manejo de opinión y en cibernética. Por lo pronto puede fácilmente apreciarse en estos llamativos resultados la disimilitud de la propagación en función de: la temática, de la cultura, del momento y del ingenio y energías puestas en juego. Estos ensayos son susceptibles de refinamientos y de complementaciones tales como determinar para cada “nodo”, que puede a su vez representar o ser representativo de una persona, sitio Web o grupo de personas, su dualidad “hub vs authority” que traducido a nuestra lengua sería dualidad “directorio - capacidad de convocatoria”: es decir un nodo puede ofrecer en forma abierta y gratuita direcciones a otros enlaces útiles o actuar como ente de difusión y al mismo tiempo, por el poder cognitivo de su contenido, atraer la atención de otros nodos. Así habrá nodos que son esencialmente “hubs” o “directorios”, otros que son esencialmente “authorities” o “convocantes” y una gran mayoría en parte “hubs” y en parte “authorities”.  Ver “HITS Algorithm” de Wikipedia y “Hubs and Authorities” del Grupo NLP, “Natural Language Processing”, de la Universidad de Stanford.

Leer más...

Sitios Inteligentes

Sitios y Portales Inteligentes Darwin

 

 

 

Hombre - Máquina: La imagen elegida para representar al desarrollo de sitios y portales Web inteligentes tiene un uso y popularidad que puede ser conocido activando directamente el buscador de Imágenes Google mediante una copia de la misma como podrían ustedes comprobar: sus 96,100 resultados (desde Buenos Aires el día 18 de Diciembre del 2012) apuntan fundamentalmente a la temática “Humans vs Robots”: Humanos versus Robots. Por su aspecto la mujer bien podría ser la genial ajedrecista húngara Judit Polgár.

Qué queremos expresar con esta imagen: por lo pronto un desafío que hasta no hace mucho se consideraba de ciencia ficción: que una máquina pudiera no solo jugar razonablemente bien al ajedrez, considerado juego ciencia, sino vencer a los mejores jugadores del mundo: ver al respecto “The Deep Blue” de IBM, la Súper Computadora Watson (también de IBM) y Otras Aplicaciones de la IA.

Ya a partir de este hito que puso de manifiesto la capacidad prácticamente ilimitada de las máquinas para memorizar y para el auto aprendizaje comenzaron a proliferar otros desafíos “impensables” que van conformando, a la larga, una evolución conjunta del par hombre-máquina.

Pros y contras de ambos: No obstante estos impactantes resultados las máquinas siguen siendo bastante “estúpidas” para tareas consideradas triviales para los humanos. Citaremos dos ejemplos, uno el reconocimiento de imágenes y otro el reconocimiento de ideas o conceptos: cualquier humano reconoce fácilmente la temática de una foto y puede encontrar también fácilmente fotos similares a una foto dada. Por el contrario, a los algoritmos y robots de reconocimiento de imágenes les es muy difícil distinguir entre una foto de niños de una de ancianos o darse cuenta de si en una determinada foto hay uno dos o más animales de una misma especie. En forma similar para el segundo ejemplo cualquier alumno de secundaria puede ser instruido para discriminar y marcar eficientemente en diarios, ensayos, revistas y libros lo sustancial de lo accesorio, una idea o concepto de lo que es relleno literario. Google con todo su poder computacional y trayectoria en trabajos de punta en semántica Web no ha podido aún crear robots capaces de detectar y clasificar conceptos.

Leer más...

Mapas Conceptuales

Mapas Conceptuales       

 

 

 

 Lo que tenemos “in mente”: Esta imagen (en su versión original expandida) ha sido extraída del IHMC, Instituto para el Conocimiento Hombre Máquina, que es una organización sin fines de lucro ubicada en el Estado de Florida, Estados Unidos, que ofrece como uno de sus principales servicios un Reservorio Público de Mapas Conceptuales.

Leer más...

Patrones de Conducta

Patrones de Conducta

¿Qué muestra la figura?: La figura muestra Springfield Punx, una colección de los más famosos “avatares” o personajes de ficción de la cultura pop, mostrados por Dean Fraser como pertenecientes o relacionados a la famosa serie de Los Simpson (o en su versión “español - Latino”). Los personajes a nuestros fines los consideraremos computacionalmente “avatares” o representación gráfica de sus “alter ego” o caracteres. 

 

 

 

Personas y avatares: La distinción entre una persona y su o sus avatares es muy importante en Internet: en efecto una persona puede tener cualquier cantidad de avatares y tiene el derecho a que tanto él o ella y sus avatares sean considerados y respetados. Esto no significa que una persona tenga el derecho de usar avatares para acciones ilegales o para expresarse incorrectamente perjudicando a otras personas o simplemente para usar la Web como escenario de liberación de bajos instintos.

Los agentes Darwin están creados y entrenados para distinguir claramente a personas de avatares siendo una de sus tareas identificar “patrones de conducta” de la gente y/o de sus avatares pero despersonalizándolos, es decir se informan de sus actividades en la Web pública pero sin registrar sus datos de identificación manteniendo su anonimato.

Leer más...

Encuestas ("Surveing")

Relevamientos y Encuestas

Ver Distintos tipos de “Surveys” del Reservorio de e-books en PDF e Internet Surveys, documento desclasificado de la Rand Corporation.

 

 

 

¿Qué muestra la imagen?: La imagen: pertenece a un artículo e infografía del Chicago Sun Times denominada

New Agers and Creationists should not be President”, que vale por Ni Creacionistas ni “New Agers” deberían postularse para presidente. En la parte infográfica se muestran diversas imágenes relacionadas con creencias supuestamente extremas o esotéricas y que también supuestamente deberían ser sustentadas relativamente por unos pocos tales como una de las fuertes conjeturas del “Creacionismo”, según la ONG Consultores para la Tolerancia Religiosa, que afirma que el mundo fue creado por Dios en seis días y al séptimo descansó. Al respecto sería creacionista aquel que cree que efectivamente así sucedió, digamos en seis días y no hace más de 10.000 años y no como una alegoría.

 

Leer más...

Más artículos...

  1. Metadata
  2. Big Data

Subcategorías

  • Creación de Conocimiento

    Experiencia de Detección y Recuperación de Conocimiento

    A partir de Contenido Semánticamente relacionado

    Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo. , 24 Febrero 2013

     

    Introducción

     

     

    Grafo de Conocimiento, a partir del contenido de sitios Joomla en base a Node XL

     

    La Web Semántica: En ésta sección iniciaremos una serie de artículos que pretenden ser nodos de un grafo semánticamente relacionado. El objeto es detectar y recuperar conocimiento nuevo disperso acerca de una temática dada que en nuestro caso sería: Tecnologías de Punta para la implementación de una Web Semántica. La idea central es que la Web es un universo cognitivo en el cual TODO está conectado con TODO y TODOS con TODOS.

    Contenido semánticamente estructurado: Dentro del inmenso “Océano Web” subyacen hoy unos 30.000 millones de documentos o páginas Web organizados en “clusters” o aglomeraciones de conocimiento relacionados a su vez entre sí por “temas”, y dentro de ellos por subtemas y los temas agrupados a su vez en “grandes temas”, medicina, filosofía, matemáticas, entretenimientos, etc., constituyendo en su conjunto la Web Semántica.

    Buscadores y navegadores: Para recorrer este universo contamos actualmente con los buscadores y navegadores. Si quisiéramos detectar y recuperar una gran temática, como por ejemplo “Medicina”, podríamos hacerlo en forma personal o mediante agentes. En ambos casos debemos recorrer un muy largo camino de de preguntas y/o de opciones en el que cada respuesta y la lectura de cada opción nos van enriqueciendo en conocimiento y orientando hacia la próxima pregunta y/o la próxima opción.

    Desentrañando la madeja: En síntesis lo que vamos haciendo es desentrañar una “madeja” de conocimiento comenzando por cualquier punta. Llegará un momento en el cual habremos llegado a la conclusión de que ya hemos adquirido el conocimiento suficiente que a lo largo de nuestra exploración hemos ido sumariando en algún documento accesible, por ejemplo en carpetas de nuestra computadora personal y/o en algún lugar de la nube Web. ¿Cómo darnos cuenta de que hemos recorrido prácticamente todo lo necesario para adquirir conocimiento específico en un cierto grado?. Por ahora subjetivamente y de acuerdo al siguiente criterio: De cada “paso”, “eslabón” o “nodo” de nuestro camino formando parte y sumado a la memoria de los pasos anteriores surgirá una imagen mental de duda o de convicción: en respuesta a preguntas que nos vamos haciendo tales como: ¿ha quedado alguna idea, concepto, keyword o palabra no suficientemente aclarada?. Por la negativa deberemos seguir explorando; por la afirmativa deberíamos abocarnos a rever todo lo documentado a fin de corroborar si de ello (lo documentado) podemos extraer el conocimiento buscado.

    La exploración: Hemos planificado realizar una exploración a razón de un nodo (artículo) diario durante un año, con lo cual tendríamos 365 artículos y definidos unos 10.000 conceptos de los cuales aproximadamente 3.000 serían no repetidos. Es decir dentro de un año tendríamos escrito una especie de “ebook” de 365 páginas en base a un Vocabulario Controlado de unos 3.000 conceptos que supuestamente tratará sobre las aplicaciones de punta en Inteligencia Artificial orientada a la Semántica Web.  

    Semantic pill”: Cada página la editaremos como “píldoras” semánticas (“pills”) o nodos de un camino semántico de aprendizaje continuo, desde 001gn al 365gn (gn por “graph node”) con el siguiente formato:

    xxx.gn

    Imagen

    Acrónimo: si lo hubiera

    Referencias Google: nnnn, a fecha tal

    Autoridades:

    1. URL1

    2. URL2

    ………..

    Descripción: en no más de uno a dos párrafos

    Metadada:

    EN: [conceptos y/o keywords separados por coma en inglés]

    ES: [conceptos y/o keywords separados por coma en español]

     

  • Metodologías

    En ésta sección iremos informando sobre la Metodología Darwin y sus derivadas, tales como la Metodología Aiware que opera sobre reservorios de datos previamente estructurados por la Metodología "madre" Darwin. 

Additional information