nl

HIDD

Dit project betreft de ontwikkeling van een historische database van de Vlaamse dialecten om dialectsyntaxis te bestuderen. De dataset is gebaseerd op de RND-zinnen. De oorspronkelijke gegevens zijn gedigitaliseerd als PDF’s (zie website project RND), maar zijn niet gemakkelijk doorzoekbaar, aangezien men elke zin waarin men interesse heeft in de 16 (gescande) atlassen manueel moet opzoeken. Bovendien kunnen de gegevens tegenwoordig niet worden gebruikt door internationale onderzoekers zonder kennis van de plaatselijke dialecten, noch door leken die het fonetische schrift niet kunnen lezen. De voorgestelde databank is een pilootstudie en bevat momenteel 126 van de 1956 locaties waarin er zinnen opgevraagd werden, vooral uit Frans-Vlaanderen, West-Vlaanderen en Oost-Vlaanderen. Het zal mogelijk zijn de gegevens te doorzoeken met filters op basis van plaats, regio, zinsnummer, of meer geavanceerd op basis van de part-of-speech-tag via regular expressions. De fonetische tekens zullen worden vertaald in een orthografische representatie in twee lagen: één dicht bij het dialect en één dicht bij het Nederlands. De website is nog in ontwikkeling.