Imagen de avatar anacareaga
Ana Lilia Careaga

En Busca del Conocimiento: Encuéntralo con Knowledge Graph

Abstract
When you search, you’re not just looking for a webpage. You’re looking to get answers, understand concepts and explore knowledge. Google has unveiled the “Knowledge Graph” search engine, which they’re calling the “first step in the next generation of search.” The initial release was launched on May 16 th 2012 and it is gradually rolling out to U.S. English users and consists of three elements:
  • Links to different sets of results based on contextual meanings for any given search term
  • Topic summaries with key facts visible in the sidebar of the SERPs (Search Engine Results Page)
  • “Information boxes” that offer additional information in the SERPs sidebar based on popular related queries.
———————————————————————————————————
Introducción
La única vez que tuve la oportunidad de ver y escuchar a Carlos Fuentes en persona fue en el homenaje que se le hizo por su 80 aniversario en la Sala Nezahualcóyotl del Centro Cultural Universitario (Noviembre 2008) con el coloquio “El arte de narrar” . En medio del tumulto y expectación, la Sala Nezahualcóyotl se vio rodeada de jóvenes entusiasmados y ansiosos por ver de cerca a dos de los escritores más importantes de la lengua española: Carlos Fuentes y Gabriel García Márquez (Premio Nobel Literatura, 1982). Afuera la espera de los jóvenes por conseguir un lugar no alteró su ánimo y algunos llevaban consigo a Aura y la edición especial de Cien Años de Soledad con la esperanza de ser autografiados en algún momento a pesar de confesar, algunos, nunca haberlos leído. Ante la insistencia de los jóvenes se abrieron las puertas, pero no pasó mucho tiempo cuando los gritos de emoción se cortaron de tajo porque no había cabida para todos y fue necesario cerrarlas. El rector de la UNAM, José Narro, salió para calmarlos y agradecer su presencia e interés por los escritores y unos cuantos segundos después, regresó al recinto para dar inicio al evento. El programa del coloquio “El arte de narrar” inscrito por los 80 años de vida y 50 de la primera edición de su novela “La región más transparente” anunciaba originalmente la participación de Gabriel García Márquez como Presidente Honorario y a Sealtiel Alatriste como presidente de la mesa. Sin embargo, de última hora invirtieron los papeles y Alatriste tomó la palabra. En la mesa también participaron los escritores Nélida Piñón, Tomás Eloy Martínez, Sergio Ramírez, Juan Goytisolo y la Nobel de Literatura sudafricana Nadine Gordimer. Después de la apertura fue Carlos Fuentes, quien con su notable elegancia y sonrisa en el rostro, subió al podio desde las butacas de las primeras filas de esta sala para hablar del arte de narrar. Se veía contento y agradecido y dirigió sus palabras especialmente a los jóvenes. Con la fuerza característica con la que solía enhebrar sus palabras y su magisterio en el arte de narrar nos hizo sentir la belleza de la escritura y el placer para el que la lee. Su entusiasmo no solo por la vida sino por la literatura nos encendió y la elegancia estilística de sus palabras narrando nos hizo ver cómo la literatura nos puede servir para ir “en contra de toda oligarquía económica, para defendernos de los atropellos que día a día nos machacan”. Recuerdo que me sentí pletórica y dichosa al escuchar estas palabras que ahora, al recordarlas, he vuelto a saborear. Él ya no está aquí pero sus pensamientos trazados e hilvanados cuidadosamente están engarzados en toda su obra literaria. Su escritura fue un regalo y leerla es el mejor homenaje que se le puede dar.
Desde muy joven, Carlos Fuentes se dio cuenta que leer y escribir eran tareas indispensables para quienes estaban decididos a comprender el mundo. El lenguaje junto con el arte, afirmaba Fuentes en numerables ocasiones, son los instrumentos idóneos para saber quiénes somos y quienes queremos ser. Él insistía que un lenguaje deficiente y un mal manejo de las palabras nos genera vacío e improductividad. Carlos Fuentes no sólo nos dejó su gran literatura sino que nos mostró con su ejemplo que la lectura y la escritura son fuentes del conocimiento y de acción. Libros como “Las buenas consciencias” o “La región más transparente” nos hacen una invitación a no quedarnos en la orilla de las realidades dadas sino abrir nuestro pensamiento a nuevas perspectivas. Porque, de acuerdo al pensamiento de Fuentes, la literatura es siempre “un manantial del que brota transparencia y en el que la música de las palabras nos muestra que el mundo está cargado de sorpresas” y es, sin duda alguna, más excepcional y rica de lo que pensamos . A través de sus novelas, Fuentes nos describió un nuevo universo del saber donde el conocimiento es capaz de multiplicarse a través de la imaginación literaria. Al acercarse a un libro como Aura, los lectores pueden recorrer un profundo sendero donde se acompaña a un personaje pasear por los caminos más oscuros para rescatar a su amada de la muerte. “Toda literatura dice lo que no puede decirse de otra forma”, y “es por ello que la novela no sólo refleja realidad, sino que crea una realidad nueva, una realidad que antes no estaba allí…
Carlos Fuentes afirmó varias veces que serán los jóvenes quienes tendrán que enmendar los errores de generaciones pasadas, caracterizadas por un enorme individualismo y ambición. Indudablemente la tecnología tendrá un papel esencial , no solo en la comunicación sino en la movilización social que nos traerán los cambios, pero no obstante, decía Fuentes, que además de tecnología, se requiere tener una comprensión y conocimiento del mundo para poderlo entonces transformar. Y esa comprensión indispensable para la transformación podía iniciarse a partir de la novela porque “a través de la imaginación y el lenguaje, la novela convierte el pasado, en memoria, y el futuro, en deseo. Pero ambos ocurren hoy, en el presente del lector que, leyendo, recuerda y desea. A través de las novelas, nuestras almas se sumergen dentro lo real a través de lo imaginario para descubrir lo que maravillosamente se esconde en las peripecias de lo cotidiano. La novela constituye un tipo concreto de conocimiento social sobre el mundo al mismo tiempo que es capaz de reinventarlo dentro de nuestros sueños”
Pero para tener ese concreto conocimiento social del mundo al que nos introduce no solo la novela sino la realidad misma es imprescindible primero tener acceso a la información. Sin información NO hay conocimiento, pero información no es conocimiento. El conocimiento es reflexión sobre la información, es capacidad de discernimiento y de discriminación, es jerarquizar y ordenar. Pero esta capacidad no se recibe como información y es necesario desarrollarla porque todo es información menos el conocimiento que nos permite aprovechar esa información.
El último cuarto del Siglo XX quedó en la historia como un punto de referencia en la transformación de la sociedad y la economía porque aquí se dieron grandes avances tecnológicos, entre los más importantes está la llegada de Internet, la cual, como todos sabemos, abrió opciones no sólo en la generación, almacenamiento e intercambio de la información, sino también en la generación de conocimiento .La información es , entonces, el insumo más importante en la sociedad basada en ese conocimiento capaz de transformar. Y para obtener información actualmente accedemos a la web mediante el uso de los motores de búsqueda como Google , los cuales en realidad aún son poco inteligentes porque en lugar de contestar una pregunta nos muestran una lista casi interminable de links con documentos a veces muy lejanos de la información que estamos buscando. Lo que la mayoría de las personas quieren son respuestas y no largas listas de documentos. Lo anterior se debe a que los motores de búsqueda operan bajo el criterio de la sintaxis y no tienen la inteligencia para comprender la semántica de las palabras claves que inscribimos en el buscador. Los motores de búsqueda funcionan enviando hordas de “arañas robóticas” (web spiders) que se desplazan a través de la red indexando las palabras clave en cada pagina que encuentran a su paso y en realidad, el resultado de la búsqueda nos muestra un índice de dichas páginas en base al ordenamiento que está establecido por un algoritmo desarrollado por Google llamado Page Rank.
Sin embargo, estos motores de búsqueda han ido evolucionando para comprender el significado de nuestras palabras, es decir, para convertirse en verdaderos buscadores semánticos que sean capaces de devolvernos resultados que realmente respondan al significado de nuestra pregunta. Knowledge Graph, es uno de varios buscadores semánticos que fue anunciado el pasado Mayo 16, 2012, casi coincidiendo con la partida de Carlos Fuentes. Knowledge Graph nos facilitará las búsquedas para la obtención de la información que analizará objetos y no sólo líneas de texto. Esta nueva funcionalidad, se ha empezado a probar en Estados Unidos y se irá extendiendo a otros países.
¿Quieres saber más de Knowledge Graph?
Continua leyendo…..
———————————————————————————————————
La Web Semántica
Hoy casi todo está representado de una u otra forma en la web, y con la ayuda de un buen buscador, podemos encontrar información sobre casi cualquier cosa que necesitemos. La web está cerca de convertirse en una enciclopedia universal del conocimiento humano. Por otra parte la web nos permite realizar diferentes actividades de nuestra vida diaria con una comodidad, economía y eficiencia sin precedentes: sin movernos de casa podemos comprar todo tipo de productos y servicios, gestionar una cuenta bancaria, buscar un restaurante, consultar la cartelera, leer la prensa, localizar a una persona, inscribirnos en la universidad o trabajar desde casa .No obstante, en este panorama tan favorable hay espacio para mejoras. Por ejemplo, el enorme tamaño que ha alcanzado la web, a la vez que es una de las claves de su éxito, hace que algunas veces la búsqueda de información sea una tarea compleja. La asombrosa eficacia de los buscadores actuales tiene también sus límites. Por ejemplo, si buscamos un “artículo sobre Carlos Fuentes”, el resultado de la búsqueda nos arroja un sin número de artículos de Carlos Fuentes pero ninguno que se trate del escritor. Este ejemplo es el síntoma de una causa común: la falta de capacidad de las representaciones en que se basa la web actual para expresar significados. Los contenidos y servicios en la web se presentan en formatos (p.ejem. HTML) e interfaces (p.ejem. formularios) comprensibles por personas, pero no por máquinas.
La Web Semántica ( Berners-Lee, 2001) propone superar las limitaciones de la web actual mediante la introducción de descripciones explícitas del significado, la estructura interna y la estructura global de los contenidos y servicios disponibles en la WWW. Frente a la semántica implícita, el crecimiento caótico de recursos y la ausencia de una organización clara de la web actual, la web semántica aboga por clasificar, dotar de estructura y anotar los recursos con semántica explícita procesable por máquinas.
Entonces la Web Semántica puede ser entendida como una web extendida, dotada de un mayor significado. Se desarrolla con lenguajes universales que permitirán a los usuarios encontrar respuestas a sus preguntas de una forma más rápida y sencilla gracias a la mejor estructuración de la información. Pero para que las máquinas puedan llevar a cabo esta función necesitan acceder a colecciones estructuradas de información y a formalismos actualmente basados en lógica matemática que les permitan tener un cierto grado de razonamiento automático. Estas necesidades pueden cubrirse utilizando “ontologías” y “metadatos” para anotar y organizar los recursos Web. Para lograr lo anterior, es necesario hacer toda una restructuración de las páginas Web y emplear nuevos lenguajes y herramientas. Algunos lenguajes desarrollados para la Web Semántica son el lenguaje estructurado XML (Extensible Markup Language) y el lenguaje RDF (Resource Description Framework) que dotan a cada página, a cada archivo y a cada recurso o contenido de la red, de una lógica y un significado permitiendo así a las computadoras y buscadores conocer el significado de la información que manejan con el fin de que ésta pueda no sólo ser presentada en pantalla, sino también que pueda ser integrada y reutilizada. Estos lenguajes deben ser estandarizados y formalizados para que su uso sea universal, reutilizable y compartido a lo largo y ancho de la web. Adicionalmente, se necesita otro lenguaje común basado en web, con suficiente capacidad expresiva y de razonamiento para representar la semántica de las ontologías. De esta forma, la utilización de lenguajes tales como OWL (Ontology Web Language) son un paso más en la consecución de la Web Semántica. Mediante este lenguaje es posible crear una ontología o biblioteca de vocabularios descriptivos/semánticos, definidos en formato RDF y ubicados en la Web para determinar el significado contextual de una palabra por medio de la consulta a la ontología apropiada.
Consecuentemente, mediante el empleo de todos estos lenguajes y algunas herramientas más, los agentes inteligentes y programas autónomos pueden rastrear la web de forma automática y localizar, exclusivamente, las páginas que se refieran a la palabra buscada con el significado y concepto precisos con el que interpretemos ese término. Por lo tanto, para potenciar el uso de ontologías en la web, se necesitan aplicaciones específicas de búsqueda de ontologías (buscadores semánticos), que permitan realizar una búsqueda específica y contextual.
Resumiendo, la tecnología anteriormente descrita se ha creado para hacer posible la Web Semántica y ésta incluye lenguajes para la representación de ontologías, lenguajes de consulta, entornos de desarrollo, módulos de gestión (almacenamiento, acceso, actualización) de ontologías, módulos de visualización, conversión de ontologías, librerías y otras herramientas que a continuación se muestran esquemáticamente:

Fuente: The Semantic Web “layer cake” as presented by Tim Berners-Lee.

  • UNICODE: Es un estándar cuyo objetivo es proporcionar el medio por el cual un texto en cualquier forma e idioma pueda ser codificado para el uso informático.
  • URI: Son cadenas que permiten acceder a cualquier recurso de la web. En la Web Semántica las URIs son las encargadas de identificar objetos.
  • XML: Provee una sintaxis elemental para las estructuras de contenidos dentro de documentos.
  • XMLSchema: Es un lenguaje para proporcionar y restringir la estructura y el contenido de los elementos contenidos dentro de documentos XML.
  • RDF: Es un lenguaje simple para expresar modelos de los datos, que refieren a los objetos “recursos” y a sus relaciones.
  • RDFSchema: Es un vocabulario para describir propiedades y clases de recursos RDF-based, con semántica para generalizar jerarquías de las propiedades y clases.
  • OWL: Es un mecanismo para desarrollar temas o vocabularios específicos en los que podamos asociar esos recursos.
  • Logic: Además de ontologías se precisan reglas de inferencia.
  • Proof: Se intercambiarán “pruebas” escritas en el lenguaje unificador de la Web Semántica.
  • Trust: Comprobación de forma exhaustiva la confianza de las fuentes de información
  • Digital Signature: Se emplea para verificación de la confianza de fuentes
Qué es un buscador semántico
Un buscador semántico es aquel que realiza el rastreo atendiendo al significado del grupo de palabras que ha introducido el usuario al realizar su búsqueda, para devolverle resultados que realmente respondan al significado de su pregunta. ¿Cómo? Rastreando en las etiquetas que se han estructurado de un modo semántico y no en los campos habituales que tienen en cuenta los algoritmos de los buscadores tradicionales (como Google o Yahoo) basados en cadenas de palabras introducidas en las etiquetas de encabezamientos (h1, h2…), o en la etiqueta título, en los links apuntan hacia esa web.
Knowledge Graph
Google presentó, de nueva cuenta, un cambio a su motor de búsqueda, con lo que espera hacer más eficiente su sistema de entrega de resultados a sus usuarios. La nueva función se deriva de una base de datos creada por Google sobre más de 500 millones de personas, lugares y cosas solicitadas frecuentemente para proveer un sumario de información sustancial que acompañe los resultados principales de la búsqueda. El cúmulo de información, al que Google denomina Knowledge Graph, tiene como fin proveer respuestas tan rápida y concisamente como sea posible, a fin de que los usuarios no tengan que hacer una selección de entre los vínculos presentados como resultados.
Google pasó los últimos dos años analizando minuciosamente la enciclopedia virtual Wikipedia, el mapa de datos de la CIA y otras fuentes para expandir una base de datos de 12 millones de entradas que obtuvo como parte de la compra de Metaweb en 2010.
La presentación de Knowledge Graph se dio una semana después de que la segunda máquina de búsqueda más grande, Bing de Microsoft Corp., anunció un ajuste que destacará más información extraída de Facebook, algo que por lo general no surge en los resultados de Google.
Knowledge Graph mejora el buscador de Google en 3 formas:
  • Encontrar lo que buscamos (Find the right thing) : Ahora podremos indicarle a Google los resultados que más nos interesen en función de nuestra búsqueda. Porque a veces el lenguaje puede ser muy confuso y mostrarnos más de lo que necesitamos. Ahora podremos elegir de qué queremos ver los resultados exactamente. Y lo veremos en la parte derecha de la pantalla.
  • Encontrar un contenido más resumido (Get the best summary): esta función permite tener resultados muy concretos y resumidos de búsquedas del tipo personajes, actores, etc. Podremos ver en la columna derecha contenido tipo artículo de wikipedia.
  • Mostrar contenido más allá (Go deeper and broader): podremos disponer de más datos adicionales relacionados con la búsqueda que hicimos mediante los “information boxes”. Por ejemplo, si buscas por Matt Groening, creador de los Simpsons, podrás saber en qué se inspiró para sacar los nombres de los personajes. Google intenta adaptarse y adelantarse a lo que posiblemente buscarás después.
Si deseas saber más detalles sobre el funcionamiento de Knowledge Graph, te recomiendo ver este video:
Otros Buscadores Semánticos:
  1. Bing: Buscador semántico de Microsoft con cambios notables que incluyen la lista de sugerencias de búsqueda en tiempo real y una lista de las búsquedas relacionadas (llamado “Panel de explorador” en el lado izquierdo de los resultados de búsqueda), basado en tecnología semántica de Powerset
  2. Swoogle: Desarrollado por la Universidad de Maryland, es un sistema de indización , recuperación y organización de la información para Documentos de la Web Semántica, lo que se denomina en Swoogle (SWDs, Semantic Web Documents), o lo que es lo mismo documentos escritos básicamente en RDF y OWL
  3. Kngine: introduce “Conceptos”. Lo primero que muestra al buscar una palabra es la información que tiene sobre esta. Por ejemplo: si buscas iPhone 4 te mostrará sus especificaciones, si buscas una ciudad te dirá los datos que tiene sobre ésta. Actualmente tiene en su base de datos más de 8 millones de conceptos.
  4. Hakia: divide sus resultados en Webs, News, Blogs, Twitter, Image y Video. A menudo puede ofrecer una definición de tu búsqueda directamente extraída de Wikipedia.
  5. Kosmix: su portada es mucho más elaborada (tiene cierto parecido a Yahoo). Se diferencia por la manera de ofrecer los resultados de búsqueda: directamente con artículos de blogs o imágenes.
  6. DuckDuckGO: lo más curioso es que cuando buscas una palabra que pueda tener doble sentido te permite elegir con qué sentido la quieres buscar. Ejemplo: buscas Apple y te pregunta quieres decir la empresa o la fruta.
  7. Evri: tiene cierto parecido a Kosmix. Puedes filtrar los resultados por artículos, citas, imágenes y tweets. Además se integra con redes sociales como Facebook o Twitter. También cuenta con una versión para iPhone.
  8. Powerset: este buscador fue adquirido por Microsoft y básicamente permite buscar en Wikipedia mejor que nadie. Ahora es empleado en Bing
  9. Truevert; este buscador encuentra cualquier término que le pidas en un contexto relacionado temas de medioambiente. Se llama a sí mismo el “buscador verde”.
———————————————————————————————————
Conclusiones
Cuando hacemos una búsqueda por Internet, no sólo estamos buscando una página web sino estamos buscando respuestas para obtener datos o comprender conceptos y entonces explorar el conocimiento. Las búsquedas semánticas han conseguido que podamos encontrar respuestas más parecidas a cómo las personas comprendemos el mundo y sin duda alguna nos facilitará esta tarea indispensable para la obtención del conocimiento, pero no podemos soslayar a la lectura , recordemos siempre que la novela constituye un tipo concreto de conocimiento social sobre el mundo necesario para poder transformarlo.
De frente ante la historia, Fuentes, junto con otros escritores del “boom latinoamericano” de la talla de Gabriel García Márquez, Julio Cortázar y Mario Vargas Llosa, nos han dejado la letra no solo para conocer nuestro entorno sino para inventar el mundo desde nuestros sueños. Todos ellos han sido escritores convencidos que, por encima de la razón, somos el territorio que habitan nuestras pasiones y anhelos.
….porque una sílaba pronunciada, una palabra dicha o una palabra inmersa en un buscador, se pierden para siempre en el pasado que acoge impasiblemente todos los presentes que constituyen el tiempo y sólo duran el instante preciso de su fugaz articulación, pero la letra queda y permanece no solo como anhelo sino como conocimiento.
La tarea aquí, como predice Carlos Fuentes, es utilizar la información, el conocimiento, el uso de la tecnología y el despertar de las ideas para el encuentro del bien. Para transformar, para innovar…para aportar a la sociedad del conocimiento y hacerla más accesible a todos, más llevadera y no permanecer más con los brazos cruzados .Utilicemos esta ráfaga de viento a favor del bien del mundo que nos tocó vivir.
“En los jóvenes está no “un futuro” para México, sino “todo el futuro” de esta nación”. “Este es un país donde 50 por ciento de la población tiene 30 años o menos, que no corresponde al sistema político, ni al económico y lo van a cambiar, de manera pacífica, progresiva y para bien”.
Carlos Fuentes, Diciembre 2011

Una respuesta para “En Busca del Conocimiento: Encuéntralo con Knowledge Graph”

  1. […] el blog nos escribe @anacareaga sobre Knowledge Graph, el cúmulo de información que Google reúne en cada búsqueda. Te recomendamos darle una leída, […]

Deja un comentario