Categorie archief: Top 2000

Top 2000: een analyse

Ik heb er al eens eerder over geschreven en vorige jaar wat getweet. Maar ik kan het niet laten. Een paar dezelfde dingen als de voorgaande jaren en wat nieuwe dingen. Gewoon, op grond van de data die beschikbaar is. Ik gebruik de lijst die staat op wikipedia. Ik heb eerst geprobeerd de lijst van de Top 200o zelf te mergen. Die verschilt echter met vorig jaar soms. Zo staat er in de oude lijst bijvoorbeeld wel eens: “Prince” en in de nieuwe “Prince and the Revolution”. En mijn Excel snapt dan niet dat dat hetzelfde is. Uiteindelijk heb ik deze lijst gebruikt. De analyse gaat over de data van 2016 behalve als dat niet zo is. Dan wordt dat aangegeven. Voel je vrij om ook aan de slag te gaan!

Als ik zin en tijd heb, zoek ik wat uit. Dat betekent 
dat dit document groeit. Kom nog eens terug om nieuwe 
dingen te bekijken.

Afijn. Hieronder staat een lijst met zaken die ik tot nu heb uitgezocht. Klik erop en je wordt verder geleid. Als je iets wil weten wat ik kan uitzoeken, hoor ik het wel. Let op: ik gebruik slechts de artiest, de titel en het jaar van uitbrengen. Vetgedrukt is onlangs toegevoegd.

Welke woorden komen het vaakst voor?

Zeker in 2016, toch op wereldschaal een beetje een annus horribilis, vind ik het fijn te zien dat LOVE weer wint.

De meest voorkomend woorden top 20:

Links zie je een overzicht van alle woorden, rechts van de woorden die interessant zijn. Het totaal aantal woorden in de titels van de Top 2000 2016 is 5979.

Zoals gezegd is “love” de winnaar. Musici zijn enorme romantici. Als je zoekt op de website wordfrequency.info zie dat “love” pas op de 391e plek komt in het Engels Corpus. Slechts 0,031% van de woorden is “love” (één op 3200 woorden). In de Top 2000 is dat 1,56%, dus één op de 64 woorden is “love”!

De Nederlandstalige top 20 samenstellen is lastig. Veel woorden in het Engels betekenen ook iets in het Engels. “Lover” bijvoorbeeld. Die haal je er natuurlijk uit: die zal veel vaker in het Engels voorkomen. Maar “me”? en “is”? 

Afijn. Ik heb een poging gewaagd met alleen maar woorden die duidelijk Nederlands zijn (hoewel, “van” is natuurlijk ook een personenbusje,…). In het begin natuurlijk veel algemene woorden. Zoals gezegd missen er een paar, zoals “me”. In mijn eenvoudige Excel-database is niet te vinden of een liedje Nederlandstalig is of niet. Dat zou ik wel kunnen doen maar is wel heel veel werk, denk ik. Later wellicht. 

Het eerste “interessante” woord dat je tegenkomt is “hart”. Wellicht logisch (“Bloedend hart”, “Houten Hart”) maar het is toch opvallend dat het woord “liefde” pas heel veel later komt (op plek 490, slechts in twee liedjes. Welke?) maar dat is natuurlijk niet helemaal eerlijk. In het Engels is “love” ook een woord voor “houden van”. Even gekeken: “hou” komt vier keer voor in de lijst. Maar goed, om een eerlijke vergelijking te maken moet ik weten hoeveel Engelstalige liedjes erin staan en hoeveel Nederlandse.

Kleuren in de Top 2000

Een andere telling die ik gedaan heb, is de telling van de kleuren, althans de Engelse. Ik gebruik een brede definitie van kleuren. “Golden” en “Silver” doen ook mee. “Ruby”, hoewel soms in gebruik als kleur, heb ik niet meegeteld. Als ik het goed zie, wordt deze naam (best vaak trouwens) gebruikt als naam.


Hierboven zie je het spectrum (ik weet, het is niet een echt fysisch spectrum) met de juiste lengtes. Zwart en blauw winnen. Kleuren worden, kennelijk vooral gebruikt in liedjes op een negatieve manier. Mijn lievelingskleur, “orange” komt, als enige kleur uit het spectrum, helemaal niet voor, evenals de niet in het echte spectrum voorkomende “pink”. 

Je ziet hiernaast de precieze percentages van alle kleuren. Ik vond overigens maar 58 keer een kleurnaam.

 

Top 2000 lichaamsdelen

Ook heb ik de lichaamsdelen geteld. Ik heb hierbij het hart (bij elkaar 22x) overgeslagen. Vooral ogen, weinig benen en vier hoofden.

 

 

 

 

 

 

 

Positief/negatief

Uit de Top 2000 valt natuurlijk niet echt het humeur van de samenleving te destilleren maar toch was ik benieuwd naar de balans tussen positieve en negatieve woorden in de teksten. En ja, ik snap dat “nothing” weliswaar negatief is maar in de zin “Nothing compares to you” juist weer positief is. Ik heb echter gewoon geteld omdat de positieve term “everything” in “there goes my everything” juist weer negatief is. Afijn.

 

 

De doden van 2016

Er zijn nogal wat popartiesten gestorven in 2016. Zoals iemand twitterde vanmorgen na het bericht van de dood van George Michael: “Welk festival wordt er in de hemel gehouden?”. Ik heb alle nummers gezongen/gespeeld dor de volgende doden zwart gemaakt:

  • David Bowie
  • Black
  • Glenn Frey (Eagles)
  • Keith Emerson (Emerson, Lake and Palmer)
  • Prince
  • Billy Paul
  • John Berry Beasty boys
  • Leonard Cohen
  • Rick Parfitt (Status Quo)
  • George Michael

Ik had ook wel Toots Thielemans mee willen nemen maar van hem (net zoals van Mieke Telkamp en Eddy Wally) staat geen nummer in de Top 2000. Klik vooral op het plaatje om hem te vergroten. 

Zelfde titels

Tweeduizend liedjes. Dan kun je natuurlijk niet verwachten dat het allemaal andere titels zijn. En dat is ook niet zo. Er zijn vier titels die twee keer voorkomen en er zijn er zelfs twee die drie keer voorkomen: “Crazy” van Seal, Gnarls Barkley en Aersomith en “One” van Mettallica van U2 en van Mary J. Blige (&U2). Queen staat er in feite twee keer in met “Somebody to love”, de tweede keer met George Michael.

De letters van de titels

Vorig jaar had ik al eens opgemerkt dat er slechts één band een palindroomnaam heeft: ABBA. En wat geestig is, is dat uitgerekend deze band één van de twee titels heeft uitgebracht die een palindroom is: SOS! De andere is Mmm mmm mmm van de Crash Test Dummies.

De wedstrijd welke is het lied met de meeste leestekens kent wel drie winnaars: het mooie lied van Ramses Shaffy: “Zing, vecht, huil, bid, lach, werk en bewonder” (vijf komma’s), “Turn! Turn! Turn! (to everything there is a reason)” en “Gimme! Gimme! Gimme! (a man after midnight). Die laatste twee hebben beiden drie uitroeptekens en twee haakjes. “In-a-gadda-da-vida” van Iron Butterfly mag er ook zijn met vier koppeltekens.

Ik heb ook gezocht naar titels met getallen in de titel. Na wat opschoonwerk in Excel (alle gewoon karakters en leestekens weg), hield ik 26 nummers over met een of meer getallen in de titel. Daarbij het ik geschreven nummers (“One” bijvoorbeeld) genegeerd. Meerder getallen in een nummer heb ik achter elkaar geplakt. En dan wint Doe Maar met “32 jaar (Sinds 1 dag of 2)”. Wellicht had Bruno Mars moeten winnen: 24k is natuurlijk 24000. Oh nee, Katie Melua. Onbetwist. “Nine million bicycles”. 

Langste en kortste titel

Sommige titels zijn enorm lang, anderen extreem kort. Ook daar heb ik naar gekeken. Hieronder zie je de twee ranglijsten. Grappig: U2 staat in beide lijstje. Een keer met “Still haven’t found what I’m looking for”  en een keer met “Bad”. De Manic Street Preachers hebben de eer met de allermeeste letters in de Top 2000 te staan: 59 bij elkaar met hun nummer: “If you tolerate this your children will be next”. 

Alfabetische titels

Houd je vast. Het wordt nu wel erg nerdy (ga gerust gewoon weer luisteren naar de Top 2000 hoor). Ik heb wat alfabetische testen gedaan. Zoals altijd schatplichtig aan Battus. 

Als eerste gekeken in welke nummers de letters van het alfabet maar een keer voorkomen. Dat zijn er nog best veel trouwens: 240 (12% dus). Bij titels die uit twee letters bestaan is dit niet zo raar natuurlijk. Langere zijn leuker. De langste staan hiernaast. Nummer 1, “Black or white” van Michael Jackson, heeft er 12, de nummers 2 hebben er 11 en de nummers 3 10.

“Lost” van Anouk (nummer 441) en “Biko” van Peter Gabriel (854) zijn de enige nummers met een lengte van vier letters die ook op alfabetische volgorde staan in het woord. Andersom kan ook: de letters staan in omgekeerde alfabetisch volgorde in de titel. Hier vinden we er twee met vijf letters: “Sonne” van Rammstein (nummer 187) en “Wrong” van Novastar. Een eervolle vermelding voor “YMCA” van De Village People natuurlijk. 

Verdeling over de jaren

Een standaardding in de statistiek: verdelingen! Gewoon vergeten tijdens het nerden. Eerst maar eens per jaar. Best interessant:

Rare dingen zitten er in. De eerste in 1939 (Strange Fruit van Billy Holiday) maar daarna in één keer vier! En niet de minste: Johnny Cash, Frank Sinatra en twee keer Elvis Presley. Even tussendoor:

Dat daarna de aantallen stijgen is logisch: de opkomst van de Rock and Roll is daar verantwoordelijk voor natuurlijk. Wel bijzonder: 1979 is het topjaar met 65 liedjes. Dat is er meer dan één per week. Het gemiddelde is zo’n 32 per jaar waarin er minstens één in voorkomt. Verder is 2010 een merkwaardig beroerd jaar: slechts 12 nummers uit de Top 2000 komen uit dat jaar. De jaren 2013 en 2014 hebben evenveel nummers in de lijst en ook best veel: 52. Dat gaat alweer naar de aantallen uit de jaren 70 terug.

De verdeling als je kijkt naar de decennia is weer wat logischer:

Je vraagt je af of dat verandert is in de loop van de top 2000. We gaan het na (kost wel even wat Excel gedoe…).

Als eerste alle uitzendjaren in een grafiek. Een (best mooie) wirwar:

Echt veel informatie is er niet uit te halen. Wel zie je dat het maximum aantal nummers uit een jaar 97 was. Dat was het jaar 1969 in het uitzendjaar 2002. Verder zie je mooi de uitzendjaren aan het einde van de grafiek. Er is daar wel iets opvallend. Je moet wel goed kijken. In 2008 stond er geen enkel nummer uit 2008 in. Maar dat kan kloppen! In 2008 was de 10e aflevering. Je kon toen niet stemmen, de lijst werd gemaakt m.b.v. de voorgaande lijsten. Lees er hier meer over.

Ook leuk om te kijken naar het totaal. Ik heb hiervoor van elk jaar het aantal nummers uitgebracht in een jaar opgeteld over alle 18 edities. Deze verdeling ziet er al bijna “normaal” uit. 

Beste jaar is duidelijk 1969 en slechtste van de “goeie tijd” is 1981.

Misschien wel de mooiste van allemaal is de verdeling per decennium over de verschillende edities. Je ziet de jaren “0” en de jaren “10” beginnen en jaren zestig langzaam uitdoven. De “hik”bij 2008 laat zich verklaren door het feit dat dit een optelling is van de voorgaande negen edities.

De onderstaande grafiek doet hetzelfde maar dan voor elk jaar in plaats van voor elk decennium. Minder goed leesbaar maar esthetisch best fijn. Zoals Per-Ivar (die heel vaak rake dingen zegt) net zegt: “Het langetermijngeheugen van de soort mens in kaart gebracht.” Klik er vooral even op, dan zie je het beter.

Heatmap jaar

En de laatste van dit jaar: een heatmap van het jaar van uitbrengen van de nummers van de Top 2000 van 2016. Hoe lichter hoe jonger (precies andersom als boven dus). Je ziet eigenlijk geen enkele patroon. En dat is mooi. Kennelijk zitten er oude en nieuwe nummers door elkaar heen in de Top 2000. Misschien alleen bij de eerste 100 wat meer oude (donkere nummers). Een mooi nieuw jaar gewenst!