Voorspelling GR2014 vertaald naar 2e Kamer

Screen Shot 2014-02-28 at 16.33.23Tijdens de verkiezingen in 2012 heb ik voorafgaand aan de uitslag een voorspelling gedaan over de zetelverdeling van de 2e kamer. Pp de avond de voorspelling ongeveer even fout zat als de overige voorspellers. Op zich geen slecht resultaat voor het eenvoudig tellen van berichten op sociale media! In de latere analyse zijn we op basis van statistische analyse op methoden gekomen die (denken we ..) betere resultaten opleveren. Kunnen we het dit keer beter doen bij de gemeenteraadsverkiezingen?!
Continue reading “Voorspelling GR2014 vertaald naar 2e Kamer”

Hoe twitteren politici na de verkiezingen?

Zoals we op deze plaats al vaker hebben laten zien, zijn politici behoorlijk actief op sociale media in verkiezingstijd. Iedere stem telt tenslotte. Het leek ons interessant om te meten of dit buiten verkiezingsperiode ook zo is. Zetten politici sociale media in voor de permanente campagne? Zien ze sociale media als een manier om in contact te staan met de kiezer? We zijn eens in de data gedoken.

Er is gekeken naar de huidige Tweede Kamer-leden. Er is alleen gekeken naar Twitter,  veruit het meest gebruikte sociale medium van de huidige Tweede Kamer-leden. Van de 150 Kamerleden hebben 137 een Twitteraccount (7 PVV’ers, 3 SP’ers, 2 VVD’ers en 1 PvdA’er hebben geen Twitteraccount). Van deze 137 hebben acht Kamerleden tijdens verkiezingstijd niet getwitterd. In dit onderzoek is de data tijdens de verkiezingen (12 augustus 2012 – 12 september 2012) vergeleken met de afgelopen twee maanden (begin januari 2013 – nu).

Activiteit

Om te beginnen analyseren we het aantal tweets. In de onderstaande grafiek is onmiddellijk te zien dat politici beduidend meer twitteren in campagnetijd. Na de verkiezingen was er een adempauze. Het drukke verkeer tijdens de verkiezingen zal niemand verbazen, omdat steeds meer politici merken dat Twitter een handig middel kan zijn in verkiezingstijd. De hoeveelheid tweets van de afgelopen periode valt ons overigens zeker niet tegen:

Klik op de grafiek voor een grote weergave.

Mate van (inter)activiteit per partij

Zoals bekend kunnen sociale media op verschillende manieren gebruikt worden. Je kunt het gebruiken om je boodschap de wereld in te zenden, om te communiceren met je collega´s in de Tweede Kamer of je kunt het gebruiken om in contact te staan met de kiezer. Continue reading “Hoe twitteren politici na de verkiezingen?”

Voorspellen van verkiezingen

Bij RTL heeft Upstream tijdens de verkiezingsperiode in de TV programma’s van “Wat kiest Nederland” verslag gedaan over het gebruik van sociale media in de politieke strijd. Onder andere hebben we een voorspelling gedaan over de uitslag. Dit hadden we eerder gedaan rond de lijsttrekkersverkiezing van Sybrand Buma van het CDA en hier een beterevoorspelling gedaan dan veel peilbureau’s
In totaal zaten we er 24 zetels naast. Vergelijkbaar met de andere peilingen maar de bedoeling was uiteraard om het beter te doen. Voorspellen is moeilijk, vooral van de toekomst … De vraag die we ons achteraf gesteld hebben is of we, op basis van de beschikbare data, het beter hadden kunnen doen.
Het antwoord is: JA! In het voortraject hebben we gekozen om een 7 daags gemiddelde te nemen over de positieve berichten per partij. Door de snelle veranderingen aan het eind van de verkiezingsstrijd zaten we er naast omdat je met een meerdaags gemiddelde altijd een aantal dagen achterloopt. Daarnaast hadden we beter op basis van regressie analyse een trendlijn kunnen gebruiken: pieken en dalen worden dan genegeerd en de trend wordt beter gevolgd.

Conclusie: op basis van trendlijnen zouden we er 6 zetels naast hebben gezeten, een resultaat dat veel beter was geweest dan alle andere peilingbureau’s. Natuurlijk is achteraf de toekomst voorspellen eenvoudiger maar het geeft aan welke potentie de methode heeft. Zeker ook omdat de trends vergelijkbaar zijn met de trends die andere peilers meten maar tegen veel lagere kosten. Samen met de Vrije Universiteit gaan we kijken of we de methode verder kunnen onderbouwen.
De whitepaper over de analyse is hier te vinden
 
Eerdere artikelen over het gebruk van soiale media kun je hier vinden:
Sociale media in verkiezingstijd
Monitoren van verkiezingen op basis van sociale media
De artikelen op RTLNieuws zijn hier te vinden

Het monitoren van de verkiezingen via social meda voor RTLnieuws

318678_10151610633074852_489256859_nIn mei en juni van dit jaar schreef ik een serie van drie blogposts over de politiek (123) hier op Marketingfacts. Mede op basis van deze posts heb ik voor RTL de politiek gevolgd op basis van de sociale media. Met behulp vanCoosto heb ik analyses gemaakt van partijen, partijleiders, debatten en nog veel meer. Met deze posting willen we graag delen wat ons is opgevallen, wat we geleerd heb over de mogelijkheden en de onmogelijkheden van sociale media-monitoring.
Deze post heb ik, net als mijn eerdere politieke posts, samen geschreven met Rens Dietzvan Coosto.

Zoekstrings

De eerste opdracht was natuurlijk: hoe filter je de politieke berichten uit de grote stroom van berichten op sociale media? De meest logische optie is het gebruik van de naam van de partij of partijleider. Als deze in een bericht aanwezig is, is het meestal een politiek bericht. Dat gaat meestal goed, want partijnamen zijn bijna allemaal eenduidig in het gebruik: VVD, PvdA, PVV, CDA, SP, D66, GroenLinks (of GL). Daarna wordt het echter moeilijk. Continue reading “Het monitoren van de verkiezingen via social meda voor RTLnieuws”

Tofik Dibi, de Kloof en Kunduz: deel 3 van de politieke monitoring

kloof.jpgNa geruime tijd genoten te hebben van onze juiste voorspelling in de vorige post over de verkiezing voor de Lijsttrekker van het CDA is het de hoogste tijd voor een volgende politieke analyse met behulp van Coosto. Deze post is wederom gemaakt in samenwerking met Rens Dietz van Coosto.

Lijsstrekkersverkiezing Groen Links

Helaas zat ik tijdens de lijsttrekkersverkiezing voor GroenLinks in het buitenland, waardoor ik die niet vooraf heb kunnen voorspellen. Wel kunnen we kijken wat de voorspelling zou zijn geweest gebaseerd op de berichten vóór 6 juni. Minder spannend maar vooruit..

Figure 1: verkiezingsstrijd Groen Links

Als we kijken naar de paar weken voor 6 juni (uitslag van de lijsttrekkersverkiezing GroenLinks) dan zien we dat berichten die wel Jolande Sap maar niet Tofik Dibi melden en andersom beginnen met zeer negatief over Tofik Dibi en licht positief over Jolande Sap. In deze beginperiode zijn ook de meeste berichten geplaatst. Aangezien het vrij snel duidelijk was dat Tofik Dibi geen kans had, zag je dat de inhoud van de berichten al snel meer gingen over de schade voor GroenLinks dan over de vraag wie de lijstrekker zou worden; er waren bijvoorbeeld nauwelijks berichten in de trant van “ik stem voor …”. Gemiddeld stond Jolande Sap op een sentiment van 7 en Tofik Dibi op een sentiment van -38. Het is duidelijk dat dit een goede indicatie was voor de overwinning met ‘bijna Oost-Europese cijfers’ voor Jolande Sap. Echter, ik denk dat, omdat de discussie op de sociale media eigenlijk al niet meer over de verkiezing ging, ik me niet aan een voorspelling over percentages zou hebben gewaagd (kan ik nu veilig zeggen). Continue reading “Tofik Dibi, de Kloof en Kunduz: deel 3 van de politieke monitoring”

Wie wordt de nieuwe CDA-lijsttrekker volgens sociale media?

haersma+bumaMarketingfacts volgt samen met Coosto de verkiezingen in de aanloop naar 12 september. In deze tweede post over het monitoren van de verkiezingstijd op basis van sociale media gaan we ons wagen aan een eerste voorspelling. Gevaarlijk, maar we doen het toch: wie wordt de nieuwe CDA-lijsttrekker?
Onderwerp van de voorspelling is de verkiezing voor het CDA-lijsttrekkerschap. Omdat we zowel kunnen zoeken naar het algemene sentiment over kandidaten als het sentiment onder twitteraars die CDA in hun bio hebben staan (hierbij gaan we er van uit dat zij lid zijn van het CDA) kunnen we zien of er verschil bestaat tussen degenen die mogen kiezen voor CDA-kandidaten en die dat niet mogen maar wel een mening hebben. In het eerste geval monitoren we alle berichten in sociale media, voor de CDA-kandidaten gebruiken we alleen twitterberichten omdat we alleen daar de bio-gegevens kunnen gebruiken.

Algemeen

Als we kijken naar het totaal aantal berichten dan zien we dat in de week tot en met 16 mei er in totaal 16.389 berichten worden gevonden over één of meer kandidaten.

Henk Bleker scoort qua aantal berichten het hoogst met 7.275 berichten, gevolgd door Sybrand van Haersma Buma met 3.586 berichten en Mona Keijzer met 2.801 berichten. De overige kandidaten scoren beduidend lager. Continue reading “Wie wordt de nieuwe CDA-lijsttrekker volgens sociale media?”

Sociale media in verkiezingstijd deel 1

In samenwerking met Upstream en Coosto gaat Marketingfacts in aanloop naar de Tweede Kamer-verkiezingen in september regelmatig aandacht besteden aan de rol van sociale media in de verkiezingsstrijd door politieke onderwerpen te monitoren. Marketing en politiek hebben tenslotte veel met elkaar gemeen: beide gaan over het goed overbrengen van een idee. Vandaag de kick-off.
In 2004 hebben sociale media voor het eerst grootschalig hun intrede gedaan in de politiek. Howard Dean, presidentskandidaat in 2004, was de eerste die internet en vooral tools als Meetup.com actief gebruikte in zijn campagne. Joe Trippi heeft daar een zeer lezenswaardig boek over geschreven: “The revolution will not be televised”.
We zijn nu acht jaar verder en sociale media zijn niet meer weg te denken in de politiek. Interessant is dan ook hoe de sociale media de Tweede Kamer-verkiezingen van 12 september a.s. zullen beïnvloeden. In de komende tijd zullen we op regelmatige basis een analyse maken over:

  • waar twitteren politici (eerste en tweede kamer) over en hoeveel, wat is de trend
  • waar twitteren politiek actieve twitteraars over (definitie is een politieke term in de bio) en wat is de trend
  • welke politieke onderwerpen worden in het algemeen op sociale media besproken en wat is het sentiment. Hierbij richten we ons vooral op een aantal grote politieke onderwerpen (woningmarkt, pensioen, Europa, zorg, bezuinigingen). Continue reading “Sociale media in verkiezingstijd deel 1”

Oh Notable Where Art Thou

A few weeks ago I read a book from Jaron Lanier: “You are not a Gadget“. I am a fan of Jaron Lanier, I think he is one of the few sillicon valley insiders that really tries to think hard about the effect technology has on our lives and societies.
There was one part of the book that really got me thinking and it was about the loss of the local notables.
If we look at the long tail from Chris Anderson we are now  seeing that the long tail does exist but also creates havoc in a lot of professions due to the price pressure of the (often quite capable) amateurs. This counts for filmmakers, photographers and many other professions where there are also a lot of amateurs craving for attention. There are of course some that are succeeding and even flourishing but as a profession they are hit hard
A second effect is that in some cases there are winners that really take it all. Examples like Google, Facebook, Amazon and (some) others. These have become highly profitable companies that have become un-beatable monopolies in markets they often created themselves (but we now can not do without..).
What we are now losing is the middle ground, the vanishing local notables. On the one hand we have highly profitable de-facto monopolies and at the other end of the scale we have hordes of amateurs whose business model consist of their 15 seconds of fame and a proverbial Apple. In the area in between in the past lots of people were able to get relatively rich on a local level. The doctor, the lawyer, the local care dealer, the supermarket owner. their numbers are going down due to the transfer of part of their business to the few (global) winners and part of their business to amateurs that work for an Apple.
With their disappearance we also see a disappearance of local culture since these often were the people and companies that supported local activities. We may gain some brilliant cultural  institutions like “The concertgebouw orkest” but we will lose many local orchestra’s, museums but also social activities that will not be sponsored anymore by the local notables.
In the digital realm this is probably an enhancement of our lives. After all, we only need one concertgebouworkest since we can listen to their breathtaking digital recordings for ever after. However, we also have a physical local presence that we should cherish.
What is the answer to this dilemma I do not know, neither does Jaron. But it is certainly something we will have to think about in the years ahead.

Structured or unstructured

Tinkebell
Tinkebell

Regarding privacy a lot of fuss is often made about the information that the government collects about this. And I must say the government collects a lot.
An interesting case recently was with two criminals in the Netherlands. After stealing 21 cars they have been apprehended. The police stores every license plate in a database of every care that drives on the highway at Zwolle. It turned out that each time a stolen car drove by the same car was just behind it. This is the first time that the judge has to decide if this large database of car movements in the Netherlands can be legally used to search for clues.
As for the storage of personal information we can distinguish three domains who has access to the information: the government, (networks of) companies and the Internet.
As for the Government I am not that worried. I do believe that we have a strong democracy that will correct itself when information is misused too often. Of course that government may change. However, when it changes the government would start to implement a lot more means to spy on us anyway. As long as the use of the information is transparent I won’t lose much sleep over it.
As for companies it starts to become more complex. Banks, Supermarkets, web-stores, Google and others collect huge amounts of data. When companies combine this information it makes you feel digitally naked. Sometimes this is information that is collected without the person knowing that it is collected.
The website geencommentaar.nl had collected the IP addresses of people that signed a petition with false names after a post at another website, geenstijl.nl that asked people to invalidate the petition. These IP addresses where than supplied to other websites in order to block the people behind it. The CBP has taken action in this case.
There are rules to what kind of information can be combined but it is often a shady area. In the example above it became transparent but especially in commercial environments it will often be hidden. The risks are significant. Much of this information in the hands of insurance companies will lead to a risk selection that is, from a societal point of view, not what we want. The acquisition of hospitals by insurance companies is a dangerous move in this respect.
In this case we are talking about information collected by (fairly large) companies. And companies can be found and are subject to regulations. This means that with a good legal framework it is a subject that can be controlled to a large extent.
As for Internet things are getting messy. The Internet is more and more used by people as the context to interpret information. If someone applies for a job he or she is googled. If a social worker is looking into a case it is not only the “kinddossier” that they look at but also hyves is checked. Internet has become the context in which official information is interpreted. And context information may be more important than the official information…
Problem which information on the Internet is that it is much harder to control in presence and in use. You can not stop a company from using the information on a potential pregrancy of a candidate that they have found. And you often can not have information removed that you do not like. And sometimes people leave information on websites that is plain false in order to harm someone.
People should become much more aware how much information can be found on them. Tinkebell recently published a book with all the hate-mail she got combined with personal information of the people that had send this e-mail. The people sending the hate-mail had the idea that they could send their messages in anonymity. Of 30% of the hate-mail she has received she could find extensive personal information on the net and has published this personal information together with hate-mail. I think a brilliant action.
We can not stop the amount of personal information on the Net. It is not just the information you publish yourself but also information others publish about you. What we need is some sort of digital mirror that shows us how the world sees us through the eyes of the Internet. Just like the mirror that hangs in you hallway and where you check your physical representation before going into the world. And like how we use clothes to create an image to the outside world we will pro-actively plant information on the net to create the image we want.
Have you already checked you profile?

Transparancy in politics


I recently came across this website that is dedicated to fact checking on political statements in the USA. If you listen to the candidates for US president it is often very hard to know if they are talking the truth, bending the truth in their direction or lying outright. Interesting to see that this website (and there are several other ones like this one) are increasing the transparancy a lot. It is shocking to see how much “distorted truths” are being told by these politicians.
The power of sites like these is that it will be getting harder and harder to stretch the truth once very white lie is monitored..