Het midden van (VO) Nederland

Al mijn gehele werkzame leven sjouw ik van onderwijscongres naar onderwijscongres.

Middelpunt van Nederland in Lunteren.

Middelpunt van Nederland in Lunteren.

Urenlange reizen die overigens vaak heel plezierig zijn als je met fijne collega’s reist. Meestal vinden deze congressen plaats rondom Utrecht want dat is “het midden van het land”. En dat waag ik te betwijfelen. De meeste mensen wonen namelijk in de Randstad en dus is het niet zo gek om te denken dat het “gewogen midden”van het land wellicht iets westerlijk ligt dan het “geografische midden”.

Over het geografische midden is overigens ook al lang een grote strijd aan de gang. Plaatsjes waar verder niet zoveel te doen is, zoals Putten, Soest, Baarn, Amersfoort en Lunteren, claimen deze eer. Zie: http://nl.wikipedia.org/wiki/Geografisch_middelpunt_van_Nederland

Maar hoe vind je het “gewogen midden” van Nederland voor wat betreft leraren? Ik ben van een eenvoudig principe uitgegaan. Ik ben op zoek gegaan naar de geografische coördinaten (lengte- en breedtegraad) van alle scholen. Ik heb het aantal docenten op die school vermenigvuldigd met de lengte- en de breedtegraad, tel alle waarden bij elkaar op en gedeeld het door het totaal aantal docenten. Dit is wat in de wiskunde het gewogen gemiddelde heet. In formulevorm (verbeterd, dank je Wouter van Joolingen): formuleHierin is b de breedtegraad van een school, a het aantal docenten van die school, i de teller en n het totaal aantal scholen/locaties.

En dan moet je op zoek naar fatsoenlijke data. Is die er? Het blijkt dat de Dienst Uitvoering Onderwijs (DUO) onderwijsdata beschikbaar heeft onder de noemer Open Onderwijsdata. Per onderwijssector zijn daar verschillende databestanden te downloaden. Mooi. Zie: http://www.duo.nl/organisatie/open_onderwijsdata/databestanden/vo/adressen/default.asp

Bij het kopje “Voortgezet onderwijs” heb ik het adressenbestand en het personeelsbestand gedownload. Aan de slag!

Het zijn Excel-files die je kunt downloaden en de eerste slag heb ik dan ook gedaan ik dan ook in Excel. Onkruid wieden. Er staan bijvoorbeeld in het personeelsbestand heel veel interessante data over jaren, leeftijden, geslacht, aantal directieleden, regio’s en nog veel meer maar die heb ik voor mijn doel niet nodig. Ik hield over een kolom met de BRIN-nummers van de scholen en het aantal docenten dat daar werkt. BRIN-nummers zijn de unieke nummers waarmee scholen worden geïdentificeerd, het Basis Registratie Instellingen-Nummer (BRIN-nummer is dus dubbelop, realiseer ik me nu; hetzelfde als BOM-moeder).

Dan het adressenbestand. Daarvoor had ik een tool nodig die iets meer toegesneden is op de taak die ik wilde verrichten. Ik moest namelijk van de adres gegevens, lengte- en breedtegraadcoördinaten maken. Ik heb Google Refine gebruikt, dat tegenwoordig OpenRefine heet (zie: http://openrefine.org). Google had het eerst onder haar hoede maar heeft het afgestoten en het wordt tegenwoordig door vrijwilligers onderhouden.

In OpenRefine kun je een verbinding maken met andere webdatabases, zoals Google Maps (ook met Twitter, Facebook etc.). Via een commando kun je een adres naar Google Maps sturen die dan weer de locatiegegevens terugstuurt. Daaruit zijn heel eenvoudig de lengte- en breedtegraad te halen.

Een export naar Excel leverde toen de volgende situatie op: we hebben een tabel met BRIN-nummers en de lengte- en breedtegraad en een tabel met BRIN-nummers en de hoeveelheid docenten per BRIN-nummer. Ik was er dus bijna.

Jammer genoeg is data nooit exact toegesneden op je wens. Ten eerste heeft een school die meer vestingen heeft, meestal maar één BRIN-nummer. Maar de vestingen staan apart in dit bestand. Ik heb echter in het personeelsbestand geen gegevens per lokatie maar slechts per BRIN-nummer. Via een obscure formule (vert.zoeken) in Excel heb ik van beide tabellen, één tabel gemaakt. Achter elke locatie staat echter het totaal aantal docenten per BRIN-nummer. Dat is dus te veel! De oplossing die ik heb gebruikt is dat ik de docenten van de verschillende locaties gelijkelijk heb verdeeld over de verschillende locaties. Ik ben wiskundig niet genoeg onderlegd om het te bewijzen maar ik heb het sterke vermoeden dat dit een verwaarloosbare fout oplevert.

Verder was er niet van elke vestiging het aantal docenten bekend (hoe kan dat eigenlijk). Deze data heb ik er rücksichtslos uitgesmeten. Als je niets een de moeite neemt om het aantal docenten door te geven… Het waren er 136 bij elkaar die zo verdwenen. Gelukkig bleven er 1213 over.

En toen kwam de uitslag. Excel rekende het gewogen gemiddelde van de breedte en de lengtegraad uit: 52,10324554 NB en 5,323146213 OL. Via deze site vond ik de plek.

En ik moet zeggen, het viel me een beetje tegen. Ik had het dichterbij huis (Den Haag) gedacht en gehoopt.  Het midden van Nederland

Het midden van VO Nederland ligt tussen Zeist en Amersfoort, in Boswachterij Austerlitz. Dichtstbijzijnde adres: Trekerweg in Leusden.

Voortaan alle congressen in Leusden!

Voor de geïnteresseerden in de data: klik hier: brin_coord_aantal

Ook leuk: de geografische data op een interactieve kaart:

En de VO-scholendichtheid in Nederland:

De dichtheid van VO-scholen in Nederland.

De dichtheid van VO-scholen in Nederland.

9 gedachten over “Het midden van (VO) Nederland

    1. ajvdmeij

      Even denken. Dan moet je de lokatiegegevens en inkomens hebben van alle Nederlanders. Ik weet niet of die beschikbaar zijn. Wel een mega-interessante exercitie: het economisch centrum van Nederland. En, nee, het is niet de Zuidas!

      Reageren
  1. diederik

    Leuk voor de NWQ 2014. Je wilt alle mensen in NL bij elkaar krijgen voor een referendum. Waar kun je dat het beste doen zodat iedereen een minimale afstand hoeft af te leggen.

    Reageren
  2. Flip Schrameijer

    Superleuk !!!
    Als je zo ook les geeft, kom het wel goed met die kids.

    Zonder ook maar een iota aan je verhaal te willen afdoen, vroeg ik me nog even af of de factor bereibarheid op een of andere manier zou kunnen worden verdiskonteerd. Qua gedachtenspelletje stel ik me graag extremen voor: wat bv als het gewogen midden midden in een ravijn of een meer ligt? Dan kun je beter aan de rand/oever vergaderen, en dat weer het liefst aan de meest bereikbare kant, toch?

    Reageren
    1. ajvdmeij

      Bereikbaarheid is een probleem inderdaad. het wordt vermoedelijk extreem lastig om dit mee te nemen. Maar ik denk wel dat de uitkomst niet alk te ingewikkeld is. Het zal wel Utrecht zijn. Heel dichtbij Leusden en bovendien goed bereikbaar.

      Reageren
  3. diederik

    Je zou een scriptje kunnen maken dat via google maps uitrekent hoe ver alles is. Uitgaande van de 400 ofzo gemeentes. Daarvan een optimum locatie zoeken met maps en daarbij optellen hoe groot de afstand is van de scholen tot het centrum van elke gemeente. Die gemiddelde reistijd bij de afstanden optellen en daar een gewogen gemiddelde van maken. Maar dat schreeuwt om een scriptje. 🙂

    Reageren
  4. Talenvijn

    Helaas, het middelen van coördinaten werkt alleen maar op een platte aarde (of met een nette clustering rond de evenaar maar op hetzelfde halfrond). In werkelijkheid ligt je gemiddelde punt noordelijker. Al geef ik toe dat dat op de schaal van Nederland niet heel veel zal uitmaken (maar wel zoveel dat de laatste decimalen van je uitkomst niet kloppen).
    Ik ben wel eens op zoek gegaan naar een formule die de bolling van de aarde wel meeneemt in de berekening, maar die heb ik niet kunnen vinden.

    Reageren
  5. Pingback: Mediallespiegel. Maar dan eerlijker. - Plakken en knippen

  6. Pingback: Medaillespiegel. Maar dan eerlijker. - Plakken en knippen

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *