Web semántica
De Wikipedia, la enciclopedia libre
La Web semántica (del inglés semantic web) es la idea de añadir metadatos semánticos a la World Wide Web. Esas informaciones adicionales —describiendo el contenido, el significado y la relación de los datos— deben ser dadas de manera formal, de forma que sea posible evaluarlas automáticamente por máquinas. El destino es mejorar la World Wide Web ampliando la interoperabilidad entre los sistemas informáticos y reducir la necesaria mediación de operadores humanos.
El precursor de la idea, Tim Berners-Lee, intentó desde el principio incluir informaciones semánticas en su creación, la World Wide Web, pero por «causas diferentes» no fue posible[1]. Introdujo la Web semántica para recuperar esta omisión.
Tabla de contenidos |
[editar] Relación con la World Wide Web
En la actualidad, la World Wide Web está basada principalmente en documentos escritos en HTML, un lenguaje de marcas que sirve para crear hipertexto en Internet. HTML es válido para adecuar el aspecto visual del documento e incluir objetos multimedia en el texto (imágenes, esquemas de diálogo, etc.). Pero da pocas posibilidades para categorizar los elementos que configuran el texto más allá de las típicas funciones estructurales, como sucede con otros lenguajes de maquetación (tipo LaTeX).
HTML permite mediante una herramienta de visualización (como un navegador o un agente de usuario) mostrar por ejemplo un catálogo de objetos en venta. El código HTML de este catálogo puede explicitar aspectos como "el título del documento" es Ferretería Acme; pero no hay forma de precisar dentro del código HTML si el producto M270660 es una "batería Acme", con un "precio de venta al público" de 200 €, o si es otro tipo de producto de consumo (es decir, es una batería eléctrica y no un instrumento musical, o un puchero). Lo único que HTML permite es alinear el precio en la misma fila que el nombre del producto. No hay forma de indicar "esto es un catálogo", "batería Acme" es una batería eléctrica, o "200 €" es el precio. Tampoco hay forma de relacionar ambos datos para describir un elemento específico en oposición a otros similares en el mismo catálogo.
La Web Semántica se ocupará de resolver estas deficiencias. Para ello dispone de tecnologías de descripción de los contenidos, como RDF y OWL, además de XML, el lenguaje de marcas diseñado para describir los datos. Estas tecnologías se combinan para aportar descripciones explícitas de los recursos de la Web (ya sean estos catálogos, formularios, mapas u otro tipo de objeto documental). De esta forma el contenido queda desvelado, como los datos de una base de datos accesibles por Web, o las etiquetas inmersas en el documento (normalmente en XHTML, o directamente en XML, y las instrucciones de visualización definidas en una hoja de estilos aparte). Estas etiquetas hacen posible a los gestores de contenidos interpretar los documentos y realizar procesos inteligentes de captura y tratamiento de información.
[editar] Componentes de la Web Semántica
Los principales componentes de la Web Semántica son los metalenguajes y estándares de representación XML, XML Schema, RDF, RDF Schema y OWL. La OWL Web Ontology Language Overview describe la función y relación de cada uno de estos componentes de la Web Semántica:
- XML aporta la sintaxis superficial para los documentos estructurados, pero sin dotarles de ninguna restricción sobre el significado.
- XML Schema es un lenguaje para definir la estructura de los documentos XML.
- RDF es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos. Aporta una semántica básica para este modelo de datos que puede representarse mediante XML.
- RDF Schema es un vocabulario para describir las propiedades y las clases de los recursos RDF, con una semántica para establecer jerarquías de generalización entre dichas propiedades y clases
- OWL añade más vocabulario para describir propiedades y clases: tales como relaciones entre clases (p.ej. disyunción), cardinalidad (por ejemplo "únicamente uno"), igualdad, tipologías de propiedades más complejas, caracterización de propiedades (por ejemplo simetría) o clases enumeradas.
La usabilidad y aprovechamiento de la Web y sus recursos interconectados aumentará gracias a:
- Los documentos etiquetados con información semántica (compárese esta con la etiqueta <meta> de HTML, usada para facilitar el trabajo de los robots). Se pretende que esta información sea interpretada por el ordenador con una capacidad comparable a la del lector humano. El etiquetado puede incluir metadatos descriptivos de otros aspectos documentales o protocolarios.
- Vocabularios comunes de metadatos (Ontología (Informática)) y mapas entre vocabularios que permitan a quienes elaboran los documentos disponer de nociones claras de cómo deben etiquetarlos para que los agentes automáticos puedan usar la información contenida en los metadatos (p.ej. el metadato author tenga el significado de "autor de la página" y no el del "autor del objeto descrito en la página").
- Agentes automáticos que realicen tareas para los usuarios de estos metadatos de la Web Semántica
- Servicios Web (a menudo con agentes propios) que provean de información a los agentes (por ejemplo un servicio de garantías a quien un agente pudiera consultar sobre si un comercio electrónico tiene un historial de mal servicio o de generar correo basura).
Los proveedores primarios de esta tecnología son las URIs que identifican los recursos junto con XML y los namespaces. Si a esto se añade un poco de lógica, mediante una RDF, u otras tecnologías como los mapas temáticos y algo de razonamiento basado en técnicas de inteligencia artificial, la Web estará lista para alcanzar las aspiraciones de su inventor Tim Berners-Lee.
[editar] Temas relacionados
- W3C
- Mapas temáticos
- Dublin Core
- WordNet
- Marco de Descripción de Recursos - RDF
- Ontología (Informática)
- DAML+OIL
- FOAF-DOAC
- OWL
- Cyc
- Representación de conocimiento mediante redes semánticas
- Lógica de descripción
- Sindicación web - RSS y Atom/Echo
- Programación lógica, funcional y declarativa.
- Inteligencia Artificial
- Wikipedia semántica
- Nueva Economía
[editar] Bibliografía
- ↑ Andy Carvin: Tim Berners-Lee: Weaving a Semantic Web. Digital divide network artículos, 2005
- Pablo Castells (2003) La web semántica. Universidad Autónoma de Madrid
- Carolina García Cataño y David Arroyo Menéndez (2002) Biblioteca Digital y Web Semántica
- Asunción Gómez Pérez, Mariano Fernández López, Oscar Corcho: Ontological Engineering: with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web Springer, ISBN 1-85233-551-3
- Michael C. Daconta, Leo J. Obrst, Kevin T. Smith: The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management, John Wiley & Sons, ISBN 0-471-43257-1
- Dieter Fensel, Wolfgang Wahlster, Henry Lieberman, James Hendler: Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential, MIT Press, ISBN 0-262-06232-1
- Vladimir Geroimenko, Chaomei Chen: Visualizing the Semantic Web, Springer Verlag, ISBN 1-85233-576-9
- John Davies, Dieter Fensel, Frank van Harmelen: Towards the Semantic Web: Ontology-Driven Knowledge Management, John Wiley & Sons, ISBN 0-470-84867-7
[editar] Enlaces externos
- Introducción a la Web Semántica: Versión en español del artículo The Semantic Web: An Introduction
- Introducción a RDF
- Libby Miller and Simon Price: The Semantic Web is Your Friend, FreePint 27 mayo 2004 No.160
- Semantic Web Overview
- OWL Web Ontology Language Overview
- W3C Semantic Web initiative
- Tim Berners-Lee's 1998 roadmap paper