Registreer .frl
Nijs

It Fryske web argivearre

18 oktober 2022

Op in seminar oer de nije ronde ynternetekstinsjes rekke ik yn petear mei Kees Teszelszky, konservator by de KB, Nasjonale Biblioteek yn Den Haach. Om’t dit net de meast logyske persoan is om op dat plak tsjin te kommen, rekken wy oan ’e praat. Kees blykt as ‘konservator digitale kolleksjes’ mear as trochsneed belutsen by domeinekstinsjes. Mear spesifyk: by .frl, de ekstinsje fan en foar Friezen.

De KB is nammentlik in projekt begûn om it Nederlânske web yn kaart te bringen en te argivearjen. Oars as by ‘offline media’ lykas boeken en kranten, is ynformaasje op websiden flechtich en is der gjin argivearplicht. Om’t in hieltyd grutter diel fan ús libben him online ôfspilet, is it fan belang om ek dy digitale boarnen te bewarjen foar takomstich ûndersyk nei ús hjoeddeistige tiid. Of, sa’t Kees sels seit: “Wat do en ik online publisearje, dat is it digitale erfgoed fan de takomst.”

It Fryske domein as pilot

It hiele Nederlânske web is lykwols ekstreem grut. Om ûnderfining op te dwaan en de bêste oanpak te definiearjen, besleat de KB om in pilot te starten mei in geografysk en kultureel hast like dúdlik ôf te beakenjen diel fan it Nederlânske ynternet: it Fryske domein. Hjirby moat it wurd ‘domein’ lêzen wurde as ‘gebiet’ en net as ‘domeinnamme’.

Yn earste ynstânsje is it net it doel om alles te argivearjen. It doel is in kolleksje fan wittenskiplike wearde en dat hoecht net útputtend te wêzen. It is dêrfoaroer wol it doel om wát der argivearre wurdt, folslein te argivearjen. Dus net in pear siden fan in webside dy’tst, as it dy útkomt, op in letter momint noch in kear bydel rinst (sa’t bygelyks The Internet Archive docht), mar in folsleine trochrin fan de webside dy’t op fêste mominten werhelle wurdt.

Hoe bepaalst hokker websiden nijsgjirrich binne? Dat begjint mei in oersjoch fan alle Fryske websiden. It bestean fan de ynternetekstinsje .frl is hjirby gouden ynformaasje: de list mei alle registrearre .frl-domeinen is nammentlik gewoan op te freegjen. Der is sjoen oft der ek op in dúdlike wize Fryske domeinen ûnder oare domeinekstinsjes (bygelyks .nl en .com) meinommen wurde koene. Dat blykte lykwols sa kompleks te wêzen dat de pilot ôfbeakene is ta .frl.

De list mei te argivearjen websiden is doe op basis fan algoritmen makke. Dêrneist is it publyk frege om domeinnammen oan te leverjen dy’t neffens harren ûnmisber binne yn in argyf fan it Fryske web. Utgongspunt is dat se in ynkykje jaan moatte yn taal, kultuer, geografy of skiednis.

In typysk Nederlânske swierrichheid is dat de KB net samar in webside argivearje mei: hjirfoar moat earst de eigener op de hichte steld wurde en gjin beswier hawwe. De KB pleitet dan ek foar mear aktuele wetjouwing wat digitaal argivearjen oanbelanget, sa’t hast alle oaren lannen dat wol hawwe.

De resultaten

It .frl-projekt is noch net ôfrûn. Noch net alle websiden binne ‘crawled’ en (mei troch de koroanabeheiningen fan de ôfrûne jierren) is der noch gjin kolleksjebeskriuwing en definitive database opsteld. Op dit stuit stiet de teller op hast 10.000 argivearre websiden.

As de crawling klear is, binne de twa foarnaamste gegevenssets dy’t beskikber binne de argivearre websiden sels en in grutte samling metadata. Dizze twa boarnen biede wittenskippers de mooglikheid de foar har relevante data te selektearjen foar har eigen ûndersyk. Soks lykwols allinnich binnen de muorren fan de KB mei it each op de beheinende Nederlânske wetjouwing.

In foarbyld fan in ûndersyk dat al by it opbouwen fan it argyf dien is, is linguïstysk fan aard: it blykt dat der binnen Fryslân sels in enoarme fariaasje is yn taalgebrûk. Oft dat ek fûn wêze soe yn ûndersyk binnen de tradisjonele media is mar de fraach!

Mear witte?

Wolst mear witte oer it webargivearringsprojekt fan de KB? Op harren webside stiet in trijetal tige tagonklike filmkes oer it ferline, it no en de takomst fan webargivearring en fansels de webkolleksjes sels.

Troch Siemen Roorda, geoTLD Expert by Dotlocal.