Upload
justinvw
View
761
Download
1
Embed Size (px)
DESCRIPTION
Korte inleiding op PentaPolitica.nl, gemaakt voor developers bijeenkomst van het PoliticalMashup project (politicalmashup.nl) gehouden op 19 oktober 2010. Beschrijving van de momenteel beschikbare data, ’current work’ en plannen voor de toekomst.
Citation preview
Een korte introductie
Justin van [email protected] @justin_v_w
Bart de [email protected] @bartdegoede
PentaPolitica.nl
• In 2009 op eigen initiatief gestart na project met kamervragen
• ‘Trias Politica’ (Montesquieu)
PentaPolitica.nl
• Data over personen en partijen (‘statisch’)
• Namen, zittingen, nevenfuncties, opleidingen, etc.
• Uitingen in social media (‘dynamisch’)
• Tweets, video’s (YouTube), foto’s, blogs, etc.
Technische details• Importeren
• Verschillende API’s
• Python
• Dataopslag
• MySQL
• Frontend
• CakePHP
Partijen
• Naam
• Afkorting
• Datum van oprichting
• Logo
• Lidzittingen
‘Personalia’• Voornaam• Achternaam• Roepnaam• Initialen• Titels• Geslacht *• Biografie• Foto *• PDC-code• Geboorteplaats en -datum• Plaats en datum van overlijden
• Levensfilosofie • Loopbaan *
• Periode, instituut, functie• Nevenfuncties *
• Periode, instituut, functie• Opleidingen *
• Periode, instituut, functie• ‘Lidzittingen’
• Periode, Kamer en partij
* niet altijd volledig
Bronnen: parlement.com, tweedekamer.nl, eerstekamer.nl
Feeds
• Foto’s in verschillende formaten (gedownload)*
• Metadata van foto’s (datum, locatie, tags, etc.)
• Gebruikersinformatie (aanmaakdatum account, aantal views, etc.)
• Titel, beschrijving, tags, etc.
• De video zelf (in hoogst beschikbare kwaliteit)
• ‘Statistieken’ van video’s (aantal views, beoordelingen, etc.)
• Gebruikersinformatie (vrienden, aantal abonnementen, etc.)
• Tweets (inhoud, datum, reply op, RT, Geo-info, etc.)
• Gebruikersinformatie (van screen_name tot URL van profielachtergrondafbeelding)
• Followers en following door de tijd heen *
• (Hyves-) blogs, partijnieuws, podcasts, etc.
• Titel, samenvatting, datum van publicatie, etc.
• Downloaden van achterliggende pagina (of andere documenten; HTML + CSS + IMG, podcasts, PDF’s, afbeeldingen)
RSS
• Tweede Kamer- en kabinetsleden van Balkenende IV
• (Handmatig) geverifieerde personalia
• (Handmatig) gevonden feeds
• (Automatisch geïmporteerde) feeditems
Wat hebben we?
Wat hebben we?
• Onzekerheid over volledigheid m.b.t. feeditems
• Alleen Balkenende IV en Rutte I (exclusief ministers)
• Rijkere informatie (nog) niet opgenomen
• ‘Archief van verwijzingen’; bron kan ‘dood’ zijn
‘Onvolkomenheden’
• Importeerproces herschrijven
• Formele procedures voor het toevoegen en beheren van personen, partijen en feeds
• Uitgebreidere personalia (automatisch) verzamelen
Wat doen we nu?
• Front-end uitbreiden (compatible met ‘nieuwe’ data)
• Meer kabinetten, meer kamers
• Normalisatie van personalia
• API
• ...
Wat willen we nog?
Vragen?