Programación Web » Administrar un sitio Web » Unidad 1. Introducción:

Tecnologías de la Web semántica

Visto: 2,656

Tecnologías de la Web semántica

La representación en que se basa la Web actual, básicamente describen la forma de mostrar la información, pero no su significado.

Esto implica que las búsquedas realizadas fundamenten sus procesamientos en palabras clave sin ninguna relación semántica con los contenidos de las páginas.

La Web semántica, como una nueva visión, propone añadir un componente descriptivo a los recursos disponibles, que extienda las representaciones vigentes.

Podemos dejar de hablar de la Web semántica como si se tratara de un proyecto para futuro. Son múltiples las aplicaciones y sistemas que hacen uso de las tecnologías desarrolladas al amparo de este proyecto del World Wide Web Consortium (W3C).

El éxito que han obtenido estas tecnologías se debe a que su aplicación resulta totalmente transparente al usuario final.

En un momento dado se comienza a experimentar que ciertos buscadores funcionan mejor u ofrecen posibilidades avanzadas de filtrado o presentación de resultados.

De repente, nuevas posibilidades en las redes sociales permiten incrementar los servicios disponibles en las mismas, personalizándolos en función de los gustos y preferencias de los usuarios.

En la Web comienzan a surgir servicios que permiten consultar de forma simultánea cientos de catálogos de bibliotecas o museos.

Incluso es posible incluir en nuestro sitio Web contenidos publicados en otros sitios de una forma muy simple.

Muchos de estos servicios se desarrollan con tecnologías de la Web semántica, que ofrecen grandes posibilidades de integración y reutilización de datos.

Por este motivo, resulta de gran interés aportar una visión global y simple de la Web semántica al alcance de profesionales, docentes, alumnos y personas interesadas no especialistas en la materia.

Son numerosos los ejemplos de casos en los que las personas que desarrollan las tecnologías y las herramientas no son las mismas que posteriormente las aplican, utilizan y que aportan nuevos conocimientos y experiencias a través de su uso, haciendo posible su mejora y consiguiente evolución.

Un poco de historia

No hace muchos años, allá en el inicio de la década de 1980, fueron muchos los que vaticinaron un nuevo mundo.

En esa visión, tal vez fundamentada en la aparición de la informática personal, los seres humanos tendrían acceso a grandes repositorios de información.

La puerta sería la computadora, y los datos, almacenados en soportes de gran capacidad, ofrecían nuevas posibilidades de integración.

No tardó mucho tiempo en aparecer el concepto de multimedia. Un único soporte para la información textual y audiovisual, que permitiría la elaboración de productos cerrados, actualizables con nuevas ediciones. En una sociedad de consumo, se trataba de un producto más.

La aparición y difusión del CD-ROM como soporte informático contribuyó a la creación de anuarios, enciclopedias, bases de datos, aplicaciones educativas y divulgativas, índices de revistas y todo un amplio abanico de aplicaciones que se actualizaban de forma periódica.

En estos entornos, la búsqueda y consulta de información utilizaba un modelo predictivo y apriorístico. Los usuarios únicamente podían acceder a la información mediante rutas de acceso más o menos delimitadas por los diseñadores del sistema.

La información podía ser localizada mediante formularios, clasificaciones y entornos de recuperación cuya dinámica de uso y contenidos sobre los que se operaban no variaban considerablemente.

Era un escenario en donde las consultas a las bases de datos en línea estaba reservadas a usuarios muy específicos (generalmente investigadores) y casi siempre a través de un intermediario, un documentalista.

Por supuesto la búsqueda de información se realizaba  sobre información textual, generalmente sin estructura e incluso sin formato.

La introducción de Internet en todos los ámbitos de nuestra sociedad, más allá del uso científico o académico, sólo fue cuestión de tiempo y revolucionó el panorama anteriormente descrito.

Las aplicaciones como el correo electrónico o la Web, han tomado tanto peso en el desarrollo de contenidos digitales en línea, las redes sociales, los servicios de la banda online o la Administración electrónica se hacen impensables sin estas herramientas.

Como consecuencia, la Web se ha convertido en un instrumento de uso cotidiano para el intercambio de información en nuestra sociedad, llegando a superar a medios como la televisión, y se ha constituido, junto con el papel, en uno de los medios de publicación más importante en la sociedad actual.

Por tanto, la Web actual, ha evolucionado hacia usos que han trascendido la idea original de Tim Berners-Lee.

Ya no estamos hablando de un sistema para publicar y comunicar resultados de experimentos y trabajos de investigación.

Sobre aquella Web, se basada en la interconexión de documentos mediante enlaces de hipertexto, se han creado nuevas herramientas gracias al desarrollo de lenguajes de programación para la Web y su integración con sistemas de base de datos.

El concepto de Sistema de Gestión de Contenidos plantea la Web como una plataforma universal para la creación de todo tipo de herramientas, cuyo uso únicamente precisa del usuario un sólo software esencial: el navegador Web.

Los usuarios comenzaron a interactuar con la Web más allá de la búsqueda y consulta de información.

Las funcionalidades de creación de contenidos textuales y audiovisuales y la comunicación entre individuos y grupos cristalizó en una nueva generación de herramientas conocida como Web 2.0 o Web social, orientadas a facilitar la conexión entre las personas.

El factor humano dejó de ser un elemento pasivo para convertirse en una agente activo en la Web.

La idea fundamental se centra en el establecimiento de redes o comunidades de usuarios que trabajan con una serie de servicios basados en aplicaciones Web como los blogs, los servicios de publicación de contenidos multimedia, las redes sociales o las wikis.

Se trata de un uso concreto de la Web, que fomenta la colaboración para difundir e intercambiar información de forma rápida y sencilla.

Sin embargo, hemos de tener en cuenta que esta situación implica una serie de problemas derivados de la propia naturaleza de una Web en la que participan los usuarios.

Existen cantidades enormes de recursos desorganizados, duplicados o desactualizados, entre los que encontrar la información buscada termina resultando un trabajo arduo.

Los motores de búsqueda Web, aunque han mejorado en los últimos años, continúan catalogando sólo una porción pequeña de la Web y a veces producen resultados que no son pertinentes y a menudo inexactos o imposibles de encontrar.

Esto se debe a que la cantidad, estructura y originalidad de contenidos en la Web no han evolucionado paralelamente a como lo han hecho los procesos de publicación de los mismos.

Existen gran cantidad de páginas duplicadas, puesto que muchos usuarios prefieren copiar contenidos en vez de referenciarlos con enlaces de hipertexto.

Multitud de páginas hacen un uso incorrecto de metadados HTML, distorsionando su utilidad en los procesos de búsqueda.

Tampoco es posible distinguir en todos los casos el tipo de recurso recuperado durante la búsqueda: un documento informativo, una ficha de una aplicación en un servicio de descarga de pago, una entrada en un foro de debate, etc.

En este contexto, los buscadores Web son incapaces en ocasiones de ofrecer unos resultados útiles.

Desde el punto de vista de la recuperación de información en la Web se precisa el uso de metadatos, que apliquen modelos estándar para la descripción de los recursos.

Además, su desarrollo y uso mejoraría no solamente los buscadores Web, sino también ampliarían los horizontes de la Web para el intercambio y procesamiento de datos entre aplicaciones de forma automática.

Hace algún tiempo que el XML ha venido utilizándose para el intercambio de datos a fin de que estos sean interoperables a nivel sintáctico. Sin embargo, la Web semántica plantea el uso de un modelo de datos básicos como es el RDF que amplía la interoperabilidad a nivel semántico.

Además la Web semántica se organiza en una estructura multinivel que va desde la simple descripción de recursos mediante metadatos a la definición de ontologías y reglas de inferencia.

¿Qué es la Web semántica?

Para conocer que es la Web semántica, es necesario establecer los principios básicos, tanto conceptuales como tecnológicos sobre los que se asienta.

Además de saber con precisión a qué nos referimos cuando utilizamos la expresión "Web semántica", también resulta esencial conocer su arquitectura a través de un modelo que muestre tanto sus elementos, como la dinámica en torno a la cual se articulan los diferentes desarrollos tecnológicos que nos han llevado desde la Web original hasta la Web semántica.

Definiendo una idea

La Web semántica no es una Web distinta de la que originalmente fue desarrollada por Tim Berners-Lee. Al igual que la Web 2.0 se trata de un uso concreto de conjuntos de herramientas y tecnologías.

Los desarrollos de la Web semántica están basados en una serie de planteamientos e ideas bastante claras.

En este sentido, Hendler, Berners-Lee y Miller (2002) ofrecen la siguiente definición de Web semántica:

"La web semántica es una extensión de la actual Web en la que a la información disponible se le otorga un significado bien definido que permita a los ordenadores y a las personas trabajar en cooperación. Está basada en la idea de proporcionar en la Web datos definidos y enlazados, permitiendo que aplicaciones heterogéneas localicen, integren, razonen y reutilicen la información presente en la Web."

Podemos identificar varios aspectos clave en esta definición.

En primer lugar, se refiere a la Web semántica como una extensión de la Web actual. Es decir tanto las nuevas ideas, conceptos y usos de la Web, como las herramientas informáticas utilizadas para el desarrollo de los planteamientos de la Web semántica deben coexistir con el resto de aplicaciones de la Web actual.

Otro punto relevante de la definición indica la necesidad de anotar o marcar esta información con datos que proporcionen un significado bien definido (semántica) y compartido para que puedan ser enlazados.

La vinculación de datos, representados mediante estándares de la Web semántica permite la reutilización del trabajo realizado por diferentes entidades.

De este modo, un tesauro elaborado y publicado en la Web por una institución en un formato apto para la Web semántica, podría ser utilizado por un repositorio digital de otro organismo para signar descriptores de sus registros.

En el fondo nos encontramos que en realidad, la Web semántica persigue el desarrollo de mecanismos para que el intercambio de datos entre sistemas y, en última instancia, la comunicación entre hombre máquina, sea eficaz y eficiente.

Por último, la misma definición nos adelanta la posibilidad de que los sistemas informáticos podrían ser capaces de manipular e incluso reelaborar información con objetivo concretos a los problemas que se les planteen.

Similar definición es la que ofrece Berners-Lee junto con Miller (2002), en la que también exponen el modo en el que el W3C coordina la consecución de estos objetivos:

"La Web semántica es una extensión de la actual Web en la que la información disponible se le otorga un significado bien definido que permita a los ordenadores y a las personas trabajar en cooperación. La W3C Semantic Web Activity, en colaboración con un gran número de investigadores y socios industriales, se encarga de la definición de estándares y tecnologías que permitan a los datos de la Web ser definidos y enlazados de forma que puedan ser usados para una localización más eficaz, automatización, integración y reutilización entre aplicaciones."

Desde un enfoque más concreto y retomando la última parte de la definición anterior, podemos encontrar en la página Web oficial que el W3C mantiene sobre la Web semántica el siguiente contenido que puede servir a modo de definición:

"La Web semántica es la representación de datos en la Web. Es un esfuerzo colaborativo liderado por W3C con la participación de un gran número de investigadores y socios industriales. Se basa en el uso de RDF, que integra una gran variedad de aplicaciones mediante el uso de XML, para la sintaxis y el uso de URLs para su identificación."

Teniendo en cuenta los trabajos de coordinación del W3C es normal que en la definición anterior se incluyan dos tecnologías fundamentales asociadas al desarrollo de la Web semántica: la especificación RDF y el lenguaje XML RDF (Resource Description Framework) es un modelo de datos desarrollado por el W3C que ofrece una especificación para la descripción de metadatos en la Web.

Organiza la información en forma de tripletas sujeto-predicado-objeto y permite su expresión sintáctica (serialización) mediante XML.

Además también utiliza la expresión URI (Uniform Resource Identifier) para identificar de forma universal y expansible un espacio de nombres de recursos de información.

De esta definición también se desprende la existencia de una amplia colaboración, tanto a nivel científico como de diseñadores y fabricante de software, para la adopción y uso de especificaciones comunes referentes a la Web semántica.

En resumen, podría afirmarse que la Web semántica se enfoca hacia la creación de un espacio compartido para el intercambio de datos altamente estructurados.

Se trata de información cuya semántica se presenta de forma que sea relativamente "inteligible" para las aplicaciones.

Uno de los aspectos más interesantes de la Web semántica, en el que coinciden la mayoría de los autores, es que, entre otros usos posibles, facilita nuevas posibilidades de comunicación entre hombres y sistemas informáticos a través de servicios que aúnan múltiples fuentes de datos que son tratados para su procesamiento o ejecución de búsquedas de información.

De este modo no es necesario duplicar información: Las fuentes de datos se relacionan entre sí sin que importe su ubicación en la Web.

Recursos multimedia:

La Web Semántica

MetaWeb

Artículos de navegación

Acerca del Profesor

Adrián Delgado Rodríguez

Ingeniero en Computación, docente por convicción y apasionado por la programación Web.

Actualmente trabaja como Profesor para en el Centro Universitario de la Costa de la Universidad de Guadalajara y como Desarrollador Web.

Síguenos:

 

Ver el perfil completo de Hugo Adrián Delgado Rodríguez (akus.net).

Deja un comentario





Diseño de páginas Web en Puerto Vallarta y Bahía de Banderas akus.net
subir

Síguenos en Facebook

Artículo de la semana

Cómo iniciar una página WebMetodología para la creación de sitios

Comprende las fases de Análisis, Planificación, Contenido, Diseño. ¿Qué método utilizas?