Imagen de avatar anacareaga
Ana Lilia Careaga

Web 3.0: Más allá de Lucy y la Web Semántica

Abstract

Just in case you missed it, the Web now has version numbers. Web 2.0 is an interactive and social Web facilitating collaboration between people. This is distinct from the early Web (Web 1.0) which was a static information dump where people read websites but rarely interacted with them. To many, Web 3.0 is something called the Semantic Web, a term coined by Tim Berns-Lee, the man who invented the (first) World Wide Web. In essence, the Semantic Web is a place where machines can read Web pages much as we humans read them, a place where search engines and software agents can better troll the Net and find what we’re looking for. The Semantic Web isn’t a new idea. This notion of a Web where machines can better read, understand, and process all that data floating through cyberspace—a concept many refer to as Web 3.0—first entered the public consciousness in 2001, when a story appeared in Scientific American Review.. Coauthored by Berners-Lee, the article describes a world in which software “agents” perform Web-based tasks that an imaginary girl named Lucy needs to do to find a medical specialist for her mother .Web 3.0 is more than Semantic Web, it is   based on “intelligent” Web applications using:

  • Natural language processing
  • Machine-based learning and reasoning
  • Intelligent applications

This article will explore the Semantic Web, and different approaches of  Web 3.0, as well.

web3.0

Web 3.0

Introducción

Sólo en caso de estar un poco despistado,… sí, la Web tiene varias versiones .La Web 2.0 es la que, a diferencia de la temprana Web (Web 1.0) que presentaba la información de manera estática, posee interactividad social y está basada en la participación de los usuarios para crear contenidos. Para muchos, la Web 3.0 es lo mismo que la Web Semántica, la cual  es un espacio en donde las páginas Web pueden ser leídas de una manera similar en que los humanos las leen, ya que las máquinas o motores de búsqueda y los agentes de software pueden comprender mejor el contenido de lo que el usuario está buscando; es decir, se trata de un espacio donde la información tiene un significado bien definido de manera que pueda ser interpretada tanto por agentes humanos como por agentes computarizados.

Todavía no se ha incorporado completamente el cambio de actitud cultural y social que implica la Web 2.0, cuando ya se habla de Web 3.0 como  una realidad inminente que promete transformar no sólo nuestra experiencia Web, sino toda nuestra cotidianidad. El término Web 2.0 es, cuando menos, un concepto ya difundido aunque a veces todavía no muy comprendido. Aún así, a lo largo del tiempo, la gente ha ido tomando conciencia, al menos en parte, quizá no tanto de su significado, sino en el propio uso de sus aplicaciones.

Describir la Web 3.0 es como describir la casa o el auto del futuro. Es lo que el orador quiere que sea.  Es por este motivo que mucha gente se aparta de la discusión, pero en general, se asocia la Web 3.0 a una nueva etapa destinada a añadir significado a la Web, y por tal motivo se define, por el momento,  con los términos que Tim Berners-Lee [1], el creador de la World Wide Web, como una Web Semántica. Sin embargo, cabe aclarar, que no existe total  acuerdo en definirla como su  sinónimo, ni siquiera hay consenso acerca de lo que exactamente significa la Web 3.0. En lo que sí hay un consenso indiscutible, es que la Web 3.0   tiene que ver con los avances y proyectos en curso que tienden a una cada vez mayor y más eficiente incorporación de la Web a la cotidianidad. Se habla así, de conceptos tales como: Web 3D, Web centrada en multimedia y Web permanente. La Web 3.0 añadirá significado a la Web, y en el tiempo se irán conociendo  los caminos más apropiados para su desarrollo.

En este artículo se hará una exploración de lo que es Web 3.0 como Web Semántica, así como otros conceptos que ampliarán su definición actual.

Web3.0-2

Web Semántica

El inicio de la Web Semántica: El caso de Lucy

La Web Semántica no es nueva, y en general, se asocia su término  al concepto acuñado por Tim Berners-Lee, en mayo de 2001 en el  artículo publicado por él en co-autoría con  Hendler y Lassila en la revista Scientific American titulado “The Semantic Web: A New Form of Web Content that is Meaningful to Computers will Unleash a Revolution of New Possibilities”, donde se explica de forma sencilla la idea de la Web Semántica mediante un ejemplo, conocido como el “caso de Lucy”, resumido de la siguiente manera:

Los Beatles cantan “We can work it out” en el equipo de sonido de Bob cuando el teléfono suena… el teléfono avisa a todos los dispositivos que tienen “control de volumen” para que lo bajen automáticamente…es su hermana Lucy al teléfono. Su madre va a necesitar sesiones de fisioterapia y tienen que turnarse para acompañarla. Acuerdan que sus agentes (que residen probablemente en algún dispositivo móvil o celular) hagan los arreglos necesarios. El agente de Lucy recoge la prescripción de los sistemas del médico, busca clínicas en un área de 20 millas que tengan un nivel de confianza por parte de organismos fiables de“alto” o “muy alto” y que su rango de precios esté en un margen determinado. Una vez escogida la clínica, el agente de Lucy contacta con el de su hermano. Cotejan sus agendas personales y fijan las fechas en las que cada uno acompañará a su madre. Los agentes plantean las opciones a sus usuarios. A Lucy le parece bien, pero a Bob no. A la hora a la que son las sesiones, hay mucho tráfico desde su casa al hospital escogido. Así que Bob especifica a su agente criterios más estrictos de hora y localización. El agente de Bob busca otras opciones y las encuentra siempre y cuando  cambie un par de citas de su agenda. Bob lo acepta. El nuevo plan es enviado al agente de Lucy, y lo acepta”

¿Qué es la Web Semántica?

El significado de lo que es la Web Semántica se puede inferir de la yuxtaposición de los significados de los términos que la conforman (Web + Semántica) . Todos sabemos que la Web  es un sistema de documentos de  hipertexto y/o hipermedios enlazados y accesibles a través de Internet, pero quizá no  todos recordemos lo que es la semántica. El término semántica se refiere a los aspectos del significado, sentido o interpretación de una palabra, expresión o inclusive de algún símbolo o representación formal. Dentro de la lingüística, la semántica, junto con la sintaxis (forma) y la pragmática (contexto)  son los aspectos que intervienen en una expresión con significado. Actualmente la información presente en la Web se encuentra estructurada mediante lenguajes de etiquetado (HTML)  que únicamente describen la forma, es decir, la sintaxis en que dicha información debe ser presentada al usuario por el navegador pero no expresan nada sobre su significado o semántica.

A través del caso de Lucy, es posible comprender lo que hace  la Web Semántica, y puede entenderse como una Web extendida, dotada de mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida y a la ayuda de un agente inteligente.[2] Al dotar a la Web de más significado y, por lo tanto, de más semántica, se pueden obtener soluciones a problemas habituales en la búsqueda de información gracias a la utilización de una infraestructura común, mediante la cual, es posible compartir, procesar y transferir información de forma sencilla. Esta Web extendida y basada en el significado, se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semántica en la que, en ocasiones, el acceso a la información se convierte en una tarea difícil y frustrante. No se trata de una inteligencia artificial mágica que permita a las máquinas entender las palabras de los usuarios, es sólo la habilidad de una máquina para resolver problemas bien definidos, a través de operaciones bien definidas que se llevarán a cabo sobre datos existentes bien definidos.

¿Cómo funciona la Web Semántica?

Volviendo al caso de Lucy, para que la Web pudiera de forma automática definir los horarios y lugar de las citas médicas de su madre y además coordinarlas con la de su hermano, la Web  debió ser capaz de procesar contenido, razonarlo y hacer deducciones lógicas a partir de ciertos parámetros (como el de las 20 millas y precio de terapia), para después delegar tareas en el software o agente inteligente. Todas las acciones necesarias se realizaron de forma automática, de manera que el agente de Lucy, así como el de Bob pudieron entender lo que se les pidió, comprender (el contenido de los sitios) y deducir (nueva información sobre la ya obtenida)  y así poder dar una solución concreta de lo que se pedía.

Para que las máquinas puedan llevar a cabo esta función necesitan acceder a colecciones estructuradas de información y a formalismos actualmente basados en lógica matemática que les permitan tener un cierto grado de razonamiento automático. Estas necesidades pueden cubrirse utilizando “ontologías”[3] y “metadatos” [4]para anotar y organizar los recursos Web. Para lograr lo anterior,  es necesario hacer toda una reestructuración de las páginas Web y emplear nuevos lenguajes y herramientas.

Algunos  lenguajes desarrollados para la Web Semántica son  el lenguaje estructurado XML (Extensible Markup Language) y el lenguaje RDF (Resource Description Framework) que  dotan a cada página, a cada archivo y a cada recurso o contenido de la red, de una lógica y un significado  permitiendo así  a las computadoras  y buscadores conocer el significado de la información que manejan con el fin de que ésta pueda no sólo ser presentada en pantalla, sino también que pueda ser integrada y reutilizada. Estos lenguajes deben ser estandarizados y formalizados para que su uso sea universal, reutilizable y compartido a lo largo y ancho de la Web.

Adicionalmente,  se necesita otro lenguaje común basado en Web, con suficiente capacidad expresiva y de razonamiento para representar la semántica de las ontologías. De esta forma, la utilización de lenguajes tales como OWL (Ontology Web Language) son un paso más en la consecución de la Web Semántica. Mediante este lenguaje es posible crear una ontología o biblioteca de vocabularios descriptivos/semánticos, definidos en formato RDF y ubicados en la Web para determinar el significado contextual de una palabra por medio de la consulta a la ontología apropiada.

De esta forma, mediante el empleo de todos estos lenguajes y algunas herramientas más, los agentes inteligentes y programas autónomos pueden rastrear la Web de forma automática y localizar, exclusivamente, las páginas que se refieran a la palabra buscada con el significado y concepto precisos con el que interpretemos ese término. Por lo tanto, para potenciar el uso de ontologías en la Web, se necesitan aplicaciones específicas de búsqueda de ontologías (buscadores semánticos), que permitan realizar una búsqueda específica y contextual. Estas ontologías están ya disponibles en algunos  buscadores semánticos de forma gratuita.

Algunos ejemplos actuales de la Web Semántica

Ya existen muchos proyectos y buscadores que han puesto en marcha aplicaciones para el desarrollo de la Web Semántica. El más conocido es Swoogle: Semantic Web Search[5]

Swoongle

Swoongle

En mayo de 2009, Microsoft anunció el lanzamiento de Bing, un nuevo buscador basado en tecnologías semánticas. Este buscador está disponible en forma de versión definitiva para Estados Unidos, y existe una versión beta para Europa a la que se le irán añadiendo progresivamente algunas funciones de la versión estadounidense.

BING2

www.bing.com

Los resultados de los  buscadores semánticos son   bastante precisos, y en algunos casos incluso pueden responder directamente ciertas preguntas. En el cuadro de búsqueda se pueden introducir palabras, frases y preguntas. El buscador semántico usa ontologías para identificar conceptos y asociaciones entre ellos relacionados con una consulta del usuario. Google o Yahoo no son buscadores semánticos, pues se basan fundamentalmente en palabras claves y en algoritmos que generan estadísticas a partir de palabras y enlaces y no en algoritmos cognitivos que capturen el conocimiento implícito en las palabras y su contexto.

Por ejemplo, una búsqueda como “¿Quién fue Urano?” en cualquiera de esos buscadores devolverá resultados afines al séptimo planeta del Sistema Solar, cuando está claro que el propósito de la búsqueda es encontrar información sobre el dios primordial del cielo, hijo y esposo de Gea, la Madre Tierra,  en la mitología griega.

Desde un punto de vista técnico, un buscador semántico es una aplicación que comprende las búsquedas de los usuarios y los textos de los documentos de la Web mediante el uso de algoritmos que simulan comprensión o entendimiento.[6]

Conclusiones

La evolución de Internet hacia un escenario con mayor potencial y con usuarios cada vez más involucrados en su gestión y desarrollo, requiere de la incorporación de documentos con menor grado de ambigüedad semántica. La Web Semántica busca catalogar la información de los recursos Web –páginas HTML, documentos PDF, vídeos, archivos de sonido– mediante ontologías (esto es, mediante el significado de las palabras), no mediante palabras clave.

La propuesta de la Web Semántica, a pesar de haber sido realizada hace casi una década, tiene actualmente una implementación modesta. No obstante, dado que los avances de esta disciplina son demasiado lentos y dificultosos, se  cree que la solución podría estar en la combinación de las técnicas de inteligencia artificial con el acceso a la capacidad humana de realizar tareas extremadamente complejas para una computadora…estos nuevos desarrollos constituirán la Web 3.0.

La Web 3.0 será una revolución que logre una combinación efectiva entre la inclusión de contenido semántico en las páginas Web y el uso de inteligencia artificial.  Algunos desarrollos en torno a este concepto son los siguientes:

  • Web 3D [7]: se cree que en el futuro la Web será una gran alternativa al mundo real, donde se podrá recorrer el planeta a través de ella, sin abandonar el escritorio. La experiencia sería semejante al actual Google Earth. Compañías como Google y Microsoft trabajan en este tipo de proyectos.
  • La Web centrada en Multimedia[8]: Se refiere a una Web que ofrezca, no solamente búsquedas basadas en metadatos, sino por similitudes en la multimedia.
  • La Web Permanente  [9]: También llamada Web Omnipresente o “Pervasive Web” es una Web que está en todas partes, no sólo en la PC o celular sino en la ropa, joyas, automóviles, etc.


[1] Según definición de Tim Berners-Lee: “La Web Semántica es una extensión de la Web actual en la cual se dota a la información de significado bien definido para que tanto personas como computadoras puedan trabajar cooperativamente”. Es decir, utilizando la propia estructura tecnológica de la Web se pretende dotar a los recursos que en ella residen de algún elemento que añada información sobre la propia información, de manera que esta primera facilite la comunicación “con sentido semántico” entre las máquinas que forman la red y, por lo tanto, redunde en que las personas que la utilizan puedan obtener lo que desean con mayor rapidez y fiabilidad.

[2] Agente inteligente: se trata de un programa que ayuda al usuario a ciertas acciones. Por ejemplo, a rellenar formularios, elegir productos,  encontrar determinada cosa, etc. Este tipo de agentes también se denominan softbot, esto es, software robot. Usa herramientas de software y servicios basados en el comportamiento de las personas.

[3] El término ‘ontología’ (utilizado en filosofía para hablar acerca de una ‘teoría sobre la existencia’) ha sido adoptado por la comunidad de investigadores de inteligencia artificial para definir una categorización y las relaciones entre sus términos.

[4]Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismo para  etiquetar, catalogar, describir y clasificar  los recursos de la Web con el fin de facilitar la posterior  búsqueda y recuperación de la información. Este mecanismo los constituyen los llamados metadatos (datos de datos).Un metadato no es más que un dato estructurado sobre la información que hay en la Web.

[5]http://swoogle.umbc.edu/ desarrollado por la Universidad de Maryland (Baltimore, USA). Se trata de un buscador que busca  ontologías (tiene indexadas más de 10.000, documentos y términos escritos tanto en RDF como OWL). Curiosamente, tanto su propio nombre como su  interfaz de presentación son muy similares a los de Google.

[6] Abián, Miguel Ángel.” BUSCADORES SEMÁNTICOS: COMPRENDER PARA ENCONTRAR (Parte 1”).Disponible en la web: http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-1

[7] Se llama así, a lo que muchos ven como una extensión de los mundos virtuales, similar a la famosa  SecondLife o There.com

[8] La Web “Mediocéntrica” es una Web enfocada en los multimedios, donde se podrán hacer búsquedas por similitud, de imágenes, música y videos, con sólo mostrar al buscador el medio de referencia. Entre las Compañías que están trabajando en estos proyectos se encuentran Ojos y Polar Rose.

[9] Según un artículo publicado en el wiki Wadooa, el laboratorio de multimedios del MIT , ya está trabajando en estas ideas a partir de la creación de espejos de baños y ventanas de casas conectados a Internet.

Imagen: Flickr

Tags: , , , , , , , , , , ,

2 respuetas para “Web 3.0: Más allá de Lucy y la Web Semántica”

  1. Shuster dice:

    Excelente información :)

    Ya tengo un buen material para estudiar y comprender.

  2. We are a group of volunteers and starting a new scheme in our community. Your web site provided us with valuable info to work on. You’ve done an impressive job and our whole community will be grateful to you.

Deja un comentario