Data
NPO Backstage Datablog #3: Met je hoofd op tv!
Experts, BN’ers, politici. Televisieprogramma’s staan er bol van. Soms komen ze langs, in bijvoorbeeld actualiteitenprogramma’s, maar ze kunnen ook genoemd worden in nieuws bulletins, zoals het Achtuurjournaal. Met behulp van de NPO Backstage API kunnen we achterhalen hoe vaak een persoon wordt genoemd. Dit kunnen we gebruiken als een indicator voor de populariteit van een persoon. In deze blog post laten we zien hoe je dat op een simpele manier een overzicht maakt van de populariteit van een groep mensen (in dit geval politici).
Personen
Het is verleidelijk om Named Entity Recognition toe te passen om een volledige lijst van personen te krijgen, maar dat is een complexe en tijdrovende oplossing. Handiger is om een vaste lijst te nemen. Voor dit voorbeeld stellen we een lijst samen van Nederlandse politici. Dit doen we door de kamerleden van tweedekamer.nl te scrapen en door de bewindspersonen van rijksoverheid.nl te scrapen. Dit scrapen is betrekkelijk eenvoudig door gebruik te maken van BeautifulSoup:
De API gebruiken
Hierna kunnen we queries afvuren op de NPO Backstage API. We doen dit door voor elke politicus een aparte query te doen. Het totaal aantal resultaten kan eenvoudig worden uitgelezen (Met behulp van de date facet kan je zelfs het aantal resultaten per week of per maand terug krijgen!):
Het eindresultaat
Wat dan nog rest is de resultaten uit deze queries te combineren en ordenen:
De volledige code staat in de NPO Backstage Examples GitHub repository. We hebben dit nu voor politici gedaan, maar het principe gaat het ook op voor bijvoorbeeld presentatoren, of zelfs producten dan wel plaatsen.
De twee grafieken hieronder laten het resultaat zien. Niet verrassend is dat minister-president Mark Rutte de politicus is die het vaakst genoemd wordt, net voor Geert Wilders en Diederik Samsom. Bij de partijen valt op dat de fractie Klein het vaakst lijkt genoemd te worden, maar dit komt natuurlijk omdat klein als los woord ook gebruikt wordt.
Doe mee met de NPO Backstage Competitie!
Wil je ook aan de slag met de data in de NPO Backstage API? Bekijk dan vooral de documentatie. Tot en met donderdag 17 september 2015 kun je jouw app of website die gebruik maakt van data uit de NPO Backstage API insturen. Zo maak je kans op de hoofdprijs van €3.000 of één van de andere geldprijzen als je bij de beste 15 zit. Op 25 september 2015 vindt in Hilversum de prijsuitreiking plaats. Laat hier weten of je daarbij wil zijn!
Ook kun je NPO Backstage volgen op Twitter en Facebook en houd npo.nl/backstage in de gaten voor alle informatie!
Laatste berichten van Breyten Ernsting (toon alles)
- NPO Backstage Datablog #3: Met je hoofd op tv! - 31 augustus 2015
- Bouw je eigen Cultuurscraper - 21 mei 2014
- Diplotwoops: Wat verwijderde tweets van diplomaten zeggen over Oekraïne - 21 februari 2014
Waar kan ik documentatie vinden over de API?
Nogal late reactie van me, maar de NPO Backstage API bestaat niet meer en de documentatie is er dus ook niet meer.