Standard - Länkade data i Sverige
Skip to content, Skip to search

Standard

Standarder för länkade data

Att använda standarder är viktigt både för att öka nyttan men data och för att göra det enklare att hantera och använda data som publiceras. Här nedan beskrivs några av de vanligaste standarderna som används för att publicera länkade data. För varje standard hittar du ett antal "läs mer"-länkar, om du vill gå vidare och lära dig hur man använder dessa standarder eller veta mer om tekniken bakom.

Innehåll

URI - Uniform Resource Identifier

En URI är en unik identifierare för en resurs. En URI kan vara en URL (Uniform Resource Locator) om den även ger information om var resursen finns. En URI behöver alltså inte representera en resurs som går att “slå upp” på webben, utan kan även identifiera objekt i verkligheten, såsom personer och platser. Tänk dock på att det alltid är en bra idé att använda URI:er som ändå returnerar information om resursen de representerar när de slås upp, t ex i en webbläsare. På så vis kan en användare alltid förstå vad URI:n står för, även om själva resursen inte finns på webben. URI:er används i RDF för att bland annat identifiera dataelement och relationer.

Läs mer - Om URI:er

  • Cool URIs for the Semantic Web - http://www.w3.org/TR/cooluris/ – En ingående beskrivning av hur URI:er kan och bör byggas upp och vad som bör hända när någon vill hämta data från en given URI.
  • Chapter 2. Identifier Patterns - http://patterns.dataincubator.org/book/identifier-patterns.html - Kapitel 2 i Leigh Dodds och Ian Davis bok med designmönster för länkade data. Olika välbeprövade alternativ för att skapa URI:er för länkade data, presenterade i mönster-form.

RDF - Resource Description Framework

RDF är en graf-baserad datamodell som beskriver data genom så kallade tripletter. En triplett består av ett subjekt, en relation och ett objekt, och kan grafiskt illustreras som två noder med en båge mellan. RDF använder URI:er för att identifiera både noder och bågar. Ett undantag är att objekts-noden i en triplett även kan vara ett datavärde, dvs en textsträng, en siffra eller liknande, och behöver då inte ha en URI. Genom att koppla samman flera sådana tripletter får vi en graf med riktade bågar - en så kallad RDF-graf, eller RDF datamängd. Det finns ett antal olika syntaxer för att lagra och dela RDF data, bland annat en där tripletterna representeras med hjälp av XML. Till RDF hör även RDF Schema, som är ett enkelt modelleringsspråk för att beskriva schemat (modellen eller vokabulären) för en RDF datamängd.

Läs mer - Om RDF

SPARQL - SPARQL Protocol and RDF Query Language

SPARQL är ett frågespråk för att ställa frågor mot datamängder i RDF. Eftersom RDF är en graf-baserad datamodell är SPARQL utformat just för att ställa frågor mot en graf bestående av RDF tripletter. Villkoren i en urvalsfråga är normalt uppbyggda som ett triplett-mönster, där en eller flera positioner (subjekt, relation eller objekt) har bytts ut mot en variabel som representerar värdet man är ute efter. SPARQL är innehåller även andra typer av frågor än urvalsfrågor, t ex CONSTRUCT-frågor som kan användas som ett kraftfullt regelspråk för att konstruera nya RDF-grafer baserat på villkor i frågan.

Läs mer - Om SPARQL

SKOS - Simple Knowledge Organization System

SKOS är W3C-rekommendationer för hur man bör representera och publicera enkla vokabulärer, såsom thesauri, kassificeringar, taxonomier, eller kontollerade vokabulärer, i RDF. SKOS är alltså en vokabulär för att uttrycka sina egna vokabulärer, dvs ett slags metamodell för vokabulärer (s.k. “knowledge organization systems” - KOS). Här finns t ex begrepp såsom “concept” och “broader”, “narrower” och “related” som ofta förekommer i den här typen av vokabulärstrukturer. SKOS är ett bra val när din vokabulär inte behöver stödja komplex logisk inferens, utan mer ska fungera som ett sätt att “tagga” dina data. För att beskriva mer avancerade datamodeller använd istället egna OWL-ontologier (eller återanvänd någon annans ontologi), se nedan.

Läs mer - Om SKOS

  • SKOS Simple Knowledge Organization System - Home Page - http://www.w3.org/2004/02/skos/ - W3C:s webbsidor som beskriver SKOS, innehåller även frågor och svar, länkar till dokumentation och tutorials.

OWL - Web Ontology Language

OWL är ett mer uttrycksfullt modelleringsspråk (jämfört med RDF Schema) vars semantik är baserat på logik (mer specifikt s.k. Description Logic). Det innebär att en modell uttryckt i OWL kan hanteras av en generell inferensmotor för OWL, för att härleda ny information baserat på de logiska uttryck och fakta som finns tillgängliga. OWL används när man vill hantera mer avancerade restriktioner i sin datamodell än vad som är möjligt med RDF Schema, eller när man vill kunna använda automatisk logisk inferens, till exempel för att kontrollera konsistensen hos en datamängd med hänsyn till modellen (dvs att inga motsägelser finns). OWL har några egenskaper som gör det lämpligt för modeller som används på webben, men som kan kännas onaturliga för den som är van vid t ex relationsdatabaser. Bland annat gör OWL en s.k. “open world assumption”, vilket innebär att allt som inte explicit sägs vara falskt eller sant helt enkelt är okänt (men skulle kunna visa sig vara sant i ett senare skede), medan i en relationsdatabas antar vi oftast att de enda fakta som är sanna är de vi har lagrade i tabellerna.

Läs mer - Om OWL