You are here:

Gemeenschappelijke Thesaurus Audiovisuele Archieven

Het Nederlands Instituut voor Beeld en Geluid heeft samen met enkele andere Nederlandse organisaties die audiovisueel cultureel erfgoed beheren de Gemeenschappelijke Thesaurus voor Audiovisuele Archieven (GTAA) ontwikkeld. De GTAA wordt gebruikt voor het doeltreffend karakteriseren van de inhoud van audiovisueel materiaal uit het archief met labels afkomstig uit een gecontroleerde en gestructureerde lijst van termen, een thesaurus. De thesaurus wordt bij Beeld en Geluid voornamelijk ingezet in het handmatige beschrijvingsproces, maar ook meer en meer bij automatische annotatietechnieken, zoals sprekerlabeling en termextractie. Met behulp van linked data principes kunnen daarnaast verbanden worden gelegd tussen de eigen collectie en andere databronnen. Telkens fungeert de GTAA hierbij als kapstok en verbindingsmiddel.

De GTAA in werking (demo)

Wat is een thesaurus?

Een thesaurus is een gecontroleerde woordenlijst met onderlinge semantische relaties en verwijzingen tussen de termen, waardoor het zoeken in de catalogus gerichter en eenvoudiger kan plaatsvinden. Deze relaties tussen de termen zijn hiërarchisch of associatief van aard. Ze geven antwoord op vragen als: welke termen worden gebruikt die ruimer of juist specifieker het gewenste onderwerp aanduiden; op welke termen kan ik zoeken die met het onderwerp te maken hebben? Daarnaast wordt met behulp van de thesaurus voorzien in het vraagstuk van synoniemen, quasi-synoniemen, spellingsvarianten en homoniemen.

Wat voor soort thesaurus is de GTAA?

De GTAA is een 'meer-assige' thesaurus, de termen (concepten) zijn ingedeeld in meerdere categorieën of assen, ook wel concept schema's genoemd. De categorieën van termen die voor het toegankelijk maken van het materiaal gebruikt worden, zijn: Onderwerpen, of wel begrippen (bijv. zwemmen, daklozen, binnenvaartschepen, audiovisuele archieven). Een variant op de as Onderwerpen is in gebruik voor het beschrijven van materiaal op het niveau van shots en geluiden, de as Onderwerpen beeld-geluid. Onderwerpen beeld-geluid bevat naast de begrippen uit de as Onderwerpen toegevoegde concepten voor specifiek beeld (shots en stockshots) en geluid. Voorbeelden: dorpsbeelden, blaffen, begroetingen, gapen, enz. Genres en programmasoorten: deze termen geven een typering of aanduiding van de productie als geheel, ze verwijzen naar de vorm, het genre of het type programma (bijvoorbeeld: korte film, lifestyleprogramma, hoorspel, politieserie). Persoonsnamen, dit zijn eigennamen van personen die als inhoudelijk element in een productie, of als Spreker, Cast-lid of Uitvoerende kunnen voorkomen. Makers, deze as bevat persoonsnamen van makers en medewerkers aan de totstandkoming van audiovisuele producties. Namen, eigennamen van o.a. organisaties, muziekensembles, bevolkingsgroepen, oorlogen, verdragen, feest(dag)en, prijzen, producten, en titels van o.a. tijdschriften, boeken, films, radio- en televisieprogramma's (bijvoorbeeld: KLM, Hindoestanen, Kerstmis, Golfoorlog, De aanslag). Geografische namen, namen van steden, dorpen, provincies, snelwegen, landen, etc. Classificatie, dit is een rubrieksindeling bij de schema's Onderwerpen en Onderwerpen beeld-geluid, die het systematisch zoeken op onderwerpen, ook van shots en quotes, mogelijk maakt.

Wie onderhoudt de GTAA?

Beeld en Geluid beheert de GTAA en is verantwoordelijkheid voor het regelmatig aanpassen van de thesaurus aan de actualiteit en het beschikbaar maken voor externe partijen. Voor meer informatie over (het gebruik van) de GTAA kun je contact opnemen met de afdeling Metadatabeheer van het Nederlands Instituut voor Beeld en Geluid. 

Email: thesaurus@beeldengeluid.nl

Waar kan ik de GTAA vinden?

Sinds 2012 wordt de GTAA in een OpenSKOS repository opgeslagen en toegankelijk gemaakt. Sinds november 2012 is er een OpenSKOS editor beschikbaar, waarin gezocht kan worden naar termen.

Waar kan ik de GTAA downloaden?

De GTAA is beschikbaar als SKOS in XML/RDF en kan met behulp van OAI-PMH geharvest worden vanaf de data provider. Via de Open Knowledge Foundation kan een dump van de GTAA worden gedownload. Deze is echter reeds enige tijd niet geactualiseerd.

Wat is SKOS?

SKOS omvat de ontwikkeling van specificaties en normen voor het gebruik van kennis-organisatiesystemen (KOS), zoals thesauri, classificatieschema's, onderwerpregelsystemen en taxonomieën in het kader van het Semantic Web.

En wat is OpenSKOS?

OpenSKOS is een webapplicatie gebaseerd op SKOS, die door softwareleverancier Picturae in Heiloo is ontwikkeld ten behoeve van erfgoedorganisaties, met financiering vanuit het NWO-onderzoeksprogramma CATCHPlus.

Welke rechten gelden er voor de GTAA?

Beeld en Geluid stelt de GTAA beschikbaar aan derden onder de Open Database License (OdbL).

Wie maken (geheel of deels) gebruik van de GTAA?

Erfgoedinstellingen

Nederlands Instituut voor Beeld en Geluid, Eye Filmmuseum, Nationaal Archief, Rijksdienst voor Cultureel Erfgoed, Naturalis

Projecten

CATCHPlus, Waisda, Woordentikkertje

Universiteiten

Vrije Universiteit

Afkortingen

  • GTAA: Gemeenschappelijke Thesaurus Audiovisuele Archieven

  • RDF: Resource Description Framework

  • SKOS: Simple Knowledge Organization System (using Concepts)

  • ISO: International Organization for Standardization

  • LOD: Linked Open Data

  • OAI-PMH: OpenArchives Initiative Protocol for Metadata Harvesting