Verslag Digitaal Erfgoedloket vragenuur: Wikidata voor en door het erfgoedveld

Op woensdag 24 november 2021 vond een online vragenuur van het Digitaal Erfgoedloket plaats. Spreker bij deze bijeenkomst was Hay Kranen, zelfstandige in de sectoren erfgoed, journalistiek en kunst waarvoor hij digitale producten bouwt. Ook is Hay sinds 2005 fervent Wikipediaan en deskundig met andere Wikimedia projecten zoals Wikimedia Commons en Wikidata. Dagvoorzitter van de bijeenkomst was Annika Blonk-van den Bercken. De uitnodiging voor de bijeenkomst is verstuurd aan gemeenten en erfgoedorganisaties in Noord-Holland. Zestien personen hebben zich aangemeld, waarvan elf aanwezig.

Wikipedia als wereldwijde vrije encyclopedie

Wikipedia, Wikidata en Wikimedia zijn drie van 22 projecten van de Wikimedia-gemeenschap, ondersteund door de Wikimedia Foundation. In 2001 is Wikipedia opgezet met het idee om een vrije encyclopedie te realiseren die iedereen kan gebruiken. Dit is nog altijd het uitgangspunt voor alle projecten. De inhoud staat onder vrije licentie, en kan dus kosteloos gebruikt worden zonder juridische, economische of technologische beperkingen, ook voor commerciële doeleinden.

Wikipedia staat op de dertiende plek van ’s werelds meest bezochte websites volgens Alexa.com. Dat is bijzonder aangezien de Wikimedia Foundation wereldwijd ‘slechts’ duizend medewerkers heeft en afhankelijk is van donaties. De inhoud wordt geschreven en gecreëerd door vrijwilligers, de ‘Wikimedia-gemeenschap’. Uit een peiling tijdens de bijeenkomst bleek onder andere dat vier deelnemers nog nooit een Wikipedia-artikel hebben bewerkt, drie deelnemers hebben hier al wel ervaring mee.

Wikimedia Commons

Wikidata kan niet los gezien worden van Wikimedia Commons. Wikimedia Commons is de plek voor mediabestanden zoals afbeeldingen, audio en video. Een enkele afbeelding is vanuit Wikimedia Commons makkelijk te koppelen en herbruikbaar op soms wel honderden plekken binnen de diverse Wikimedia projecten. Dit scheelt opslagcapaciteit, is minder foutgevoelig en informatie is makkelijker herleidbaar dan wanneer je hetzelfde plaatje overal afzonderlijk uploadt. De universele taal op Wikimedia Commons is daarom Engels.

Wikidata

Wikidata is een vrije kennisbank met momenteel zo’n 96 miljoen data-items (status november 2021) die aan elkaar gelinkt zijn. Dit zijn onder meer alle Wikipedia-artikelen en wereldwijd bijna tien miljoen bekende personen. Wat Nederlandse informatie betreft, gaat het onder meer om alle gemeenten, rijksmonumenten, plaatsen, straten, wegen en pleinen. Het is niet de moeite waard om voor alle items een Wikipedia-artikel te maken. Van deze fenomenen zijn immers al gegevens beschikbaar uit andere datasets.

Elk data-item heeft een uniek Q-nummer en kan, net als beeldmateriaal op Wikimedia Commons, op meerdere plekken gebruikt worden. Data-items staan beschreven met gegevens volgens een vast model dat is gebaseerd op de linked open data principes. Een belangrijk voordeel hiervan is dat iedereen Wikidata kan bevragen. Denk bijvoorbeeld aan zoekvragen, zogenoemde ‘query’s’, zoals: ‘geef alle rijksmonumenten die zijn gebouwd in periode 1870-1920 in Noord-Holland van architect Pierre Cuypers’, of ‘geef alle schilderijen in kunststroming Y/gemaakt in stad Z/door een kunstenaar die leerling was van kunstenaar X’. Interessant is dat de zoekresultaten vervolgens op verschillende manieren getoond kunnen worden en gebruikt kunnen worden voor eigen doeleinden. Denk daarbij aan weergave in een lijst, op een kaart (wanneer de data coördinaten bevat), in grafieken of in tabellen.

Data aanleveren aan Wikidata

Ten slotte gaf Hay een voorbeeld van een dataset over kunst in de openbare ruimte in Nijmegen die is toegevoegd aan Wikidata. Het aanleveren van nieuwe data in een dataset vereist enige technische basiskennis. Met hulp van diverse tools en software heeft hij de nieuwe data gelinkt aan bestaande items, zoals kunstenaars, locaties en afbeeldingen op Wikimedia Commons.

Deelnemers hadden na de presentatie van Hay enkele vragen:

Ik heb al meerdere Wikipedia-artikelen geschreven, maar deze krijgen niet automatisch een Wikidata Q-nummer. Hoe werkt dat?

Q-nummers moeten apart worden toegevoegd aan een artikel. Maar ze zijn eigenlijk pas van belang voor Wikidata zodra er andere taaledities van eenzelfde pagina zijn. Deze artikelen moeten ook handmatig aan elkaar gelinkt worden.

Hoe zorg je ervoor dat gevoelige informatie niet vervuild wordt door informatie die je er niet op wil hebben, en dat onjuiste informatie gesignaleerd en gecorrigeerd wordt? Is de wiki-community zelf vooral deze ‘waakhond’?

Een deel kan gecontroleerd worden door middel van tools, automatische scripts en bots, maar een deel is ook gewoon handwerk. Hay ziet de laatste jaren wel een positieve trend waarin ook (grotere) erfgoedinstellingen zich meer bezig houden met informatie waarover zij kennis in huis hebben op de Wikimedia projecten.

Het koppelen van informatie uit datasets aan al aanwezige informatie of afbeeldingen op Wikpedia/Wikidata/Wikimedia lijkt veel handwerk aan het voorbeeld te zien. Kan dat makkelijker?

Dat ligt erg aan het onderwerp en vorm van de data. Over het algemeen kun je met de juiste technische hulpmiddelen een eind komen, al blijft een handmatige controle altijd noodzakelijk.

Waar kan ik het beste beginnen als kleine historische vereniging wanneer ik data over een (eigen) collectie online wil zetten? En kan dit ook met data die alleen online staat op een beschermde omgeving, alleen voor leden met inloggegevens bijvoorbeeld?

Voor het tonen van erfgoedgegevens op de Wikimedia projecten is de conventie dat elk item een uniek vindbare online plek heeft met een permanente URL (permalink). Als dit in orde is, hebben Wikipedianen al veel aan een Excelbestand met daarin per item de feitelijke gegevens en een verwijzing naar de bijbehorende URL. Informatie moet online te verifiëren zijn voor iedereen, wat niet het geval is bij gebruik van een beschermde omgeving. Ook is het interessant om informatie van Wikidata te gebruiken voor intern gebruik. Bij bepaalde collecties of records in het collectiebeheersysteem kan je linken naar relevante Wikidata-items over personen, plaatsen en meer middels het Q-nummer.

Meer weten

Hulp nodig bij het gebruik van Wikidata of andere vragen rond het verzamelen, digitaliseren, beheren en delen van (digitaal) erfgoed of digitale collecties? De digitaal-erfgoedcoach staat klaar met advies op maat, geheel kosteloos en te bereiken per mail: info@steunpunterfgoednh.nl.

Nuttige bronnen:
Meer weten

Hulp nodig bij het gebruik van terminologiebronnen of andere vragen rond het verzamelen, digitaliseren, beheren en delen van (digitaal) erfgoed of digitale collecties? De digitaal-erfgoedcoach staat klaar met advies op maat, geheel kosteloos. Te bereiken per mail: info@steunpunterfgoednh.nl.

(Beeldverantwoording: ‘Kinderen werken met een Apple Macintosh Classic computer,’ Redmer Yskaschool. 30-10-1990. Noord Hollands Archief. Collectie Historische Vereniging Texel)