Het Corpus Gysseling-Van Reenen van 13e-eeuwse Middelnederlandse oorkonden CGR13

Het Corpus Gysseling-Van Reenen (CGR13) van 13e-eeuwse Middelnederlandse oorkonden bestaat uit 1571 gedateerde en gelokaliseerde oorkonden. Het is een deelverzameling van het Corpus dat is aangelegd door Maurits Gysseling: Corpus Gysseling, Ambtelijke bescheiden (CG). Het CG is gepubliceerd en gedigitaliseerd door het Instituut voor de Nederlandse Taal (INT) (eertijds Instituut voor Nederlandse Lexicologie - INL) onder leiding van Wil Pijnenburg. Het CG is in KWIC-formaat te vinden op

De erven Gysseling hebben het CG vrij toegankelijk gesteld voor onderzoekers.

Het CG bestaat uit vrijwel alle nog bestaande 13e-eeuwse oorkonden ('Ambtelijke bescheiden') in het Middelnederlands, originelen en copieën. Het CGR13 is tot stand gekomen op basis van lokaliseerbaarheid en dateerbaarheid voor taalkundig onderzoek: van zulke teksten kan worden verwacht dat ze plaatselijk (eventueel regionaal) taalgebruik representeren. Copieën moesten daarom ook worden uitgesloten. Ook de lokaliseringen van het CG waren niet altijd geschikt voor dit type geografisch taalonderzoek. Alle oorkonden zijn daarom opnieuw gelokaliseerd door Pieter van Reenen, criteria ontleend aan Dees et al. (1980).

Voor wat betreft de morfologische codering en de lemmatisering heeft het INT (INL) op suggestie van Maaike Mulder en Piet van Reenen indertijd besloten hetzelfde systeem te kiezen als voor het CRM14 is gebruikt. Dit ter vergemakkelijking van onderzoek op basis van de beide corpora. In een latere fase van samenwerking met het INT - tot stand gekomen middels Sjef Barbiers - is deze codering en lemmatisering aangevuld en verbeterd door Pieter van Reenen. Deze verbeterslag is nog niet helemaal voltooid. Daardoor is het nu al zo dat de onderzoeker nauwelijks verschillen tegenkomt tussen CRM14 en CGR13. Hopelijk kan voor de 15de en de 16de eeuw dezelfde codering en lemmatisering dienen.

De woorden van de oorkonden van het CG zijn in eerste instantie door het INL(INT) taalkundig gecodeerd en voorzien van lemma's. Later zijn de ontbrekende codes en lemmatiseringen, benevens correcties aangebracht door Pieter van Reenen. Vervolgens zijn de oorkonden door Pieter van Reenen geklassificeerd in termen van zeven genres, en waar mogelijk/relevant in termen van plaats/regio en tijd. De genres zijn opgesteld aan de hand van de volgende kriteria:

  • origineel - copie
  • lokaal (regionaal) - niet lokaal (regionaal)
  • jaar van ontstaan - niet dateerbaar
  • Latijn/Frans - Nederlands

Dat heeft geresulteerd in 7 deelcorpora:

  • CGR13GrHol = Graven van Holland
  • CGR13GrVla = Graven van Vlaanderen
  • CGR13HerBr = Hertog van Brabant
  • CGR13NoLoc = niet lokaliseerbaar
  • CGR13 of CGR13.txt = gelokaliseerde en gedateerde oorkonden
  • CGR13Latijn = overwegend Latijn of Frans
  • CGR13copie = niet originele oorkonden

NaamorigineellokaalMiddelnederlandsaantal woorden
CGR13GrHol+-+464.382
CGR13GrVla+-+103.365
CGR13HerBr+-+58.302
CGR13NoLoc+-+587.034
CGR13.txt+++7.796.082
CGR13Latijn+nvt-269.424
CGR13copie-nvt+1.140.840

Samenvattend: Aan de basis van de website middelnederlands.nl ligt voor wat betreft de 13e eeuw alleen het CGR13.txt (of CGR13), verreweg het grootste deelcorpus. Het gaat om die oorkonden waarvan mag worden aangenomen dat ze plaatselijke (schrijf)taal bevatten. De oorkonden zijn voornamelijk afkomstig uit Vlaanderen, vooral het westelijke deel, vooral Brugge. In Holland, Zeeland, Noord-Brabant en Utrecht zijn maar weinig oorkonden beschikbaar. Daarbuiten geen.