Data
Datablog: Spotvogels dump
De VARA heeft een nieuwe data set ter beschikking gesteld: De spotvogels database.
Structuur
De dump is in SQL formaat aangeleverd. Importeren kan je eenvoudig doen met (bijvoorbeeld) het volgende commando:
mysql -u spotvogels -p spotvogels <spotvogels.sql
Het importeren levert een drietal tabellen op. In de tabel Video staan alle afleveringen. In de tabel Game kan je terugvinden welke tags bij welke video horen door een join te maken met de Game en de TagEntry tabel. Je zou kunnen kijken hoeveel tags een aflevering heeft door de volgende query:
SELECT Video.title, TagEntry.`normalizedTag`, count(*) FROM Video LEFT JOIN Game on Video.id = Game.video_id LEFT JOIN TagEntry on Game.id = TagEntry.game_id WHERE Video.id = 1 GROUP BY TagEntry.`normalizedTag`;
Alle tags voor een aflevering krijg je zo:
SELECT Video.title, TagEntry.`normalizedTag` FROM Video LEFT JOIN Game on Video.id = Game.video_id LEFT JOIN TagEntry on Game.id = TagEntry.game_id WHERE Video.id = 1;
Extra metadata
De Video tabel is van zichzelf niet rijk aan metadata. Met behulp van de kolommen prid kunnen we weliswaar naar de aflevering springen om hem te gaan bekijken (http://vara.nl/media/<Video.mediaId>), maar we kunnen niet te weten komen op welke datum de aflevering is uitgezonden. Gelukkig hebben we een weg gevonden om meer data te verzamelen. Op het moment dat een aflevering een prid heeft kan extra metadata worden verzameld door middel van een simpel HTTP request naar een REST interface (http://e.omroep.nl/metadata/aflevering/<Video.prid>). Om het jullie wat makkelijker te maken hebben we die metadata voor de afleveringen (483 stuks) alvast opgehaald en opgeslagen in JSON formaat in een bestand. Met name de titel, info en gidsdatum velden zijn nuttig.
Inschrijven
Inschrijven voor de hackathon kan hier. Extra informatie is hier te vinden.
Eigen team
Heb je al een scherp idee voor de uitwerking van je concept? Meld dan je team aan als open inschrijving. Misschien komen we interessante personen tegen die jullie verder kunnen helpen.
De Hackathon Publieke Omroep wordt mede mogelijk gemaakt door NPO en Beeld en Geluid op het Mediapark in Hilversum.
Laatste berichten van Breyten Ernsting (toon alles)
- NPO Backstage Datablog #3: Met je hoofd op tv! - 31 augustus 2015
- Bouw je eigen Cultuurscraper - 21 mei 2014
- Diplotwoops: Wat verwijderde tweets van diplomaten zeggen over Oekraïne - 21 februari 2014
Gerelateerde berichten:
- Datablog: Open Beelden API Al sinds enige tijd is de Open Beelden API beschikbaar....
- Datablog: Ster spots De ster heeft een nieuwe dataset beschikbaar gesteld. In deze...
- Datablog: Incontxt Incontxt is een aparte portal voor het beter toegankelijk maken...