<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="3.4.5">Jekyll</generator><link href="http://datenspieler.com/feed.xml" rel="self" type="application/atom+xml" /><link href="http://datenspieler.com/" rel="alternate" type="text/html" /><updated>2021-09-17T07:54:24+00:00</updated><id>http://datenspieler.com/feed.xml</id><title type="html">Datenspieler</title><subtitle>Mein Blog übers Spielen mit Daten</subtitle><entry><title type="html">Was verrät das Facebook Datenleck über Österreich?</title><link href="http://datenspieler.com/facebook/" rel="alternate" type="text/html" title="Was verrät das Facebook Datenleck über Österreich?" /><published>2021-04-07T00:00:00+00:00</published><updated>2021-04-07T00:00:00+00:00</updated><id>http://datenspieler.com/facebook</id><content type="html" xml:base="http://datenspieler.com/facebook/">&lt;p&gt;Am Ostersonntag gab es diesmal nicht nur Ostereier zu finden, sondern auch 533 Millionen Telefonnummern aus einem Facebook Datenleck, nachzulesen zum Beispiel beim &lt;a href=&quot;https://www.derstandard.at/story/2000125588856/riesiger-datendiebstahl-bei-facebook-telefonnummern-von-533-millionen-nutzern-veroeffentlicht&quot;&gt;Standard&lt;/a&gt; oder hier die ursprüngliche &lt;a href=&quot;https://www.bleepingcomputer.com/news/security/533-million-facebook-users-phone-numbers-leaked-on-hacker-forum/&quot;&gt;Bekanntmachung&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;Das weckt natürlich die Neugierde eines Datenspielers und ich habe mir die Frage gestellt, welche Erkenntnisse man aus den Daten für Österreich ziehen kann. Selbstverständlich nicht auf individueller Ebene, sprich welche Telefonnummer hat zum Beispiel Sebastian Kurz, sondern auf aggregierter Ebene für Österreich gesamthaft. So zeige ich zum Beispiel die beliebtesten Handyprovider und finde die Top 10 der Vor- und Nachnamen.&lt;/p&gt;

&lt;p&gt;Dazu kurz ein paar Worte zu den Daten, die in dem Facebook Datenleck enthalten sind. Für Österreich gibt es rund 1.2 Millionen Datensätze. Jeder Datensatz enthält neben einer Facebook-ID, eine Telefonnummer, Vor- und Nachname sowie Geschlecht. Diese Daten sind bei fast allen Datensätzen enthalten. Es gibt dann noch ein paar weitere Datenfelder - Wohnort, Heimatort, Beziehungsstatus, Arbeitgeber, E-Mailadresse, eine Jahreszahl und ein Datum. Diese Daten sind aber bei den meisten Datensätzen leer, so gibt es z.B. bei weniger als 1 Prozent der Datensätze eine E-Mailadresse. Daher habe ich mich bei meiner Analyse auf die eingangs erwähnten Datenfelder beschränkt.&lt;/p&gt;

&lt;p&gt;Bei den Analysen ist zu beachten, dass diese nicht notwendigerweise repräsentativ für gesamt Österreich sind, sondern nur für Facebook-Nutzer im Jahr 2019, die ihre Telefonnummer hinterlegt hatten.&lt;/p&gt;

&lt;h2 id=&quot;welche-handyvorwahl-und-somit-welcher-betreiber-ist-am-beliebtesten&quot;&gt;Welche Handyvorwahl, und somit welcher Betreiber, ist am beliebtesten?&lt;/h2&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/vorwahl.png&quot; alt=&quot;Vorwahl&quot; /&gt;&lt;/p&gt;

&lt;p&gt;In Zeiten der Rufnummernmitnahme ist das natürlich mit Vorsicht zu genießen, aber man sieht, dass 0664 führt, vor 0676, 0660 und 0650 - also wenig Überraschungen mit A1, Magenta, 3 und Ex-tele.ring (sprich jetzt nochmal Magenta).&lt;/p&gt;

&lt;h2 id=&quot;gibt-es-mehr-frauen-oder-männer-mit-telefonnummer-auf-facebook&quot;&gt;Gibt es mehr Frauen oder Männer (mit Telefonnummer) auf Facebook?&lt;/h2&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/geschlecht.png&quot; alt=&quot;geschlecht&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Die Männer sind mit rund 56% in der Mehrheit, “nur” 44% Frauen.&lt;/p&gt;

&lt;h2 id=&quot;wie-heißen-frau-und-herr-österreicher&quot;&gt;Wie heißen Frau und Herr Österreicher?&lt;/h2&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/Nachname.png&quot; alt=&quot;Nachname&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Bei den Nachnamen ist Gruber der Spitzenreiter, mit etwas mehr als 0.3 Prozent - knapp vor Huber, mit auch noch mehr als 0.3 Prozent.&lt;/p&gt;

&lt;p&gt;Wenn man die Vornamen betrachtet, ist bei den Frauen Andrea der Favorit mit rund 1.4 Prozent aller Frauen, vor Maria und Sabine.&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/VornameWeiblich.png&quot; alt=&quot;VornameWeiblich&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Bei den Männern ist Michael der Favorit rund 2.2 Prozent aller Männer, vor Thomas und Christian.&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/VornameMännlich.png&quot; alt=&quot;VornameMännlich&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Wenn man die Top 10 bei Frauen und Männern vergleicht, sieht man, dass die Kreativität bei Männernamen etwas geringer ist - die Top 10 Namen bei Männern decken bereits rund 17 Prozent der Männer ab, bei den Frauen sind es nur rund 12 Prozent.&lt;/p&gt;

&lt;h2 id=&quot;und-wie-sieht-es-in-deutschland-aus&quot;&gt;Und wie sieht es in Deutschland aus?&lt;/h2&gt;

&lt;p&gt;Zum Vergleich auch noch die analogen Analysen von unserem großen Bruder im Norden. Die Handyvorwahlen sind natürlich anders, die Geschlechterverteilung recht ähnlich. Bei den Nachnamen gibt es mit Müller und Schmidt nicht nur zwei andere Favoriten, sondern auch deutlich konzentriertere, mit mehr als 0.7 und mehr als 0.5 Prozent - versus etwas mehr als 0.3 Prozent in Österreich. Bei den Männervornamen gibt es eine deutliche Übereinstimmung zwischen Deutschland und Österreich - Top 2 sind z.B. mit Michael und Thomas genau gleich, in den Top 4 sind die selben 4 Namen. Die Frauennamen sind wieder “kreativer”, da gibt es größere Unterschiede bei den Top 10.&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/DE_vorwahl.png&quot; alt=&quot;Vorwahl&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/DE_geschlecht.png&quot; alt=&quot;geschlecht&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/DE_Nachname.png&quot; alt=&quot;Nachname&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/DE_VornameWeiblich.png&quot; alt=&quot;VornameWeiblich&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2021-04-07-facebook/DE_VornameMännlich.png&quot; alt=&quot;VornameMännlich&quot; /&gt;&lt;/p&gt;</content><author><name></name></author><summary type="html">Am Ostersonntag gab es diesmal nicht nur Ostereier zu finden, sondern auch 533 Millionen Telefonnummern aus einem Facebook Datenleck, nachzulesen zum Beispiel beim Standard oder hier die ursprüngliche Bekanntmachung.</summary></entry><entry><title type="html">Wann ist Tanken am günstigsten?</title><link href="http://datenspieler.com/tanken/" rel="alternate" type="text/html" title="Wann ist Tanken am günstigsten?" /><published>2020-07-21T00:00:00+00:00</published><updated>2020-07-21T00:00:00+00:00</updated><id>http://datenspieler.com/tanken</id><content type="html" xml:base="http://datenspieler.com/tanken/">&lt;p&gt;Die Anreise in den Urlaub erfolgt dieses Jahr wahrscheinlich aufgrund von Corona noch stärker mit dem eigenen Auto. Daher ist die Frage, wie man beim Tanken Geld sparen kann, besonders relevant. Ein wesentlicher Faktor ist da sicher die richtige, sprich günstige, Tankstelle. Dazu gibt es genügend Apps und Webseiten, mit denen man ebendiese Tankstelle aktuell herausfinden kann. Aber wann ist der beste Zeitpunkt?&lt;/p&gt;

&lt;h2 id=&quot;vormittags-oder-nachmittags-unter-der-woche-oder-am-wochenende---wann-tankt-man-günstiger&quot;&gt;Vormittags oder nachmittags, unter der Woche oder am Wochenende - wann tankt man günstiger?&lt;/h2&gt;

&lt;p&gt;Die natürliche Anlaufstelle für solche Fragen ist in Österreich der &lt;a href=&quot;https://www.oeamtc.at/&quot; target=&quot;_blank&quot;&gt;ÖAMTC&lt;/a&gt;, der dazu z. B. in einer &lt;a href=&quot;https://www.ots.at/presseaussendung/OTS_20200304_OTS0044/oeamtc-spritpreise-im-monatsvergleich-gesunken&quot; target=&quot;_blank&quot;&gt;Presseaussendung&lt;/a&gt; vormittags, bzw. Sonntag oder Montag empfiehlt. In Deutschland scheint die Sache anders zu sein, dort tankt man laut &lt;a href=&quot;https://www.adac.de/verkehr/tanken-kraftstoff-antrieb/tipps-zum-tanken/spritpreise-tagesverlauf/&quot; target=&quot;_blank&quot;&gt;ADAC&lt;/a&gt; abends am günstigsten.&lt;/p&gt;

&lt;h2 id=&quot;wie-kann-man-als-datenspieler-diese-frage-beantworten&quot;&gt;Wie kann man als Datenspieler diese Frage beantworten?&lt;/h2&gt;

&lt;p&gt;In Österreich müssen die Tankstellen ihre Preise an eine zentrale Stelle, den &lt;a href=&quot;https://www.spritpreisrechner.at/&quot; target=&quot;_blank&quot;&gt;Spritpreisrechner&lt;/a&gt; der E-Control melden. Über diese Seite kann man dann auch für ein gewisses Gebiet die jeweils 5 günstigsten Tankstellen abfragen. Dankenswerterweise geht das auch via einer &lt;a href=&quot;https://api.e-control.at/sprit/1.0/doc/index.html?url=https://api.e-control.at/sprit/1.0/api-docs%3Fgroup%3Dpublic-api#/&quot; target=&quot;_blank&quot;&gt;API&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;Ich habe nun rund einen Monat lang stündlich diese Daten für meine Heimatregion, den Bezirk Mödling, abgefragt. Damit kann man die Frage nach dem günstigsten Zeitpunk fürs Tanken also mithilfe von Daten beantworten.&lt;/p&gt;

&lt;p&gt;Bzgl. des Benzinpreises gibt es in Österreich noch eine Regel, deren Auswirkung sich in den Daten zeigen wird: der Bezinpreis darf zwar täglich beliebig oft gesenkt werden, eine Erhöhung ist allerdings nur um 12 Uhr mittags erlaubt.&lt;/p&gt;

&lt;h2 id=&quot;was-hat-das-spielen-mit-den-treibstoffdaten-ergeben&quot;&gt;Was hat das Spielen mit den Treibstoffdaten ergeben?&lt;/h2&gt;

&lt;p&gt;Der ÖAMTC hat mit seinem Tipp im allgemeinen recht, Sonntag Nachmittag und Montag Vormittag sind die besten Zeiten. Interessant ist auch, dass der Preisunterschied je nach Wochentag und Uhrzeit deutlich größer ausfällt, wenn man statt des Preises der jeweils günstigsten Tankstelle, den Durchschnitt der 5 günstigsten betrachtet. Das gilt besonders für die tägliche Erhöhung um 12 Uhr.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2020_tanken/DIE_min.svg&quot; alt=&quot;Diesel, min&quot; /&gt;&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2020_tanken/SUP_min.svg&quot; alt=&quot;Super, min&quot; /&gt;&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2020_tanken/DIE_mean.svg&quot; alt=&quot;Diesel, mean&quot; /&gt;&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2020_tanken/SUP_mean.svg&quot; alt=&quot;Super, mean&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Die Ergebnisse sind für Diesel und Super recht ähnlich, bei Super sind lediglich die Preisschwankungen ein bisschen größer. So liegt die Schwankungsbreite für Super bei fast 5 Cent pro Liter, bei Diesel bei fast 4 Cent, jeweils für den Durchschnitt der 5 günstigsten Tankstellen. Bei einer Tankgröße von 60 Litern kann der Unterschied also fast 3 Euro ausmachen. Beziehungsweise rund 4 - 5 % bei einem Treibstoffpreis von grob 1 Euro.&lt;/p&gt;

&lt;h2 id=&quot;das--notebook&quot;&gt;Das  Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2020-treibstoff/treibstoff-analyse.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2020-treibstoff/treibstoff-analyse.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2020-treibstoff/treibstoff-analyse.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;</content><author><name></name></author><summary type="html">Die Anreise in den Urlaub erfolgt dieses Jahr wahrscheinlich aufgrund von Corona noch stärker mit dem eigenen Auto. Daher ist die Frage, wie man beim Tanken Geld sparen kann, besonders relevant. Ein wesentlicher Faktor ist da sicher die richtige, sprich günstige, Tankstelle. Dazu gibt es genügend Apps und Webseiten, mit denen man ebendiese Tankstelle aktuell herausfinden kann. Aber wann ist der beste Zeitpunkt?</summary></entry><entry><title type="html">Corona, was sonst? Altair!</title><link href="http://datenspieler.com/corona/" rel="alternate" type="text/html" title="Corona, was sonst? Altair!" /><published>2020-03-22T00:00:00+00:00</published><updated>2020-03-22T00:00:00+00:00</updated><id>http://datenspieler.com/corona</id><content type="html" xml:base="http://datenspieler.com/corona/">&lt;p&gt;Unser aller Leben hat sich schlagartig geändert - Corona! In dem Zusammenhang gibt es natürlich eine Unmenge an Daten, die sich stündlich ändern. Keine Angst, ich will hier keine neue Informationsseite aufbauen, ich habe ein viel bescheideneres Ziel.&lt;/p&gt;

&lt;p&gt;Ich wollte eigentlich schon sehr lange das Python Visualisierung Tool &lt;a href=&quot;https://altair-viz.github.io/&quot;&gt;Altair&lt;/a&gt; ausprobieren. Als mir zum Thema Corona eine aus meiner Sicht sehr spannende Grafik untergekommen ist, die aber nicht mehr ganz aktuell war, war das DIE Gelegenheit.&lt;/p&gt;

&lt;p&gt;Ich machte mich auf die Suche nach einer verlässlichen Datenquelle und wurde bei &lt;a href=&quot;https://ourworldindata.org/coronavirus&quot;&gt;Our World in Data&lt;/a&gt; fündig. Dort gibt es sehr viele, sehr spannende Analysen zum Thema Corona, wirklich eine Empfehlung.&lt;/p&gt;

&lt;p&gt;Dann konnte das Datenspiel beginnen. Als völliger Neuling beim Thema &lt;em&gt;Altair&lt;/em&gt; sowie &lt;em&gt;&lt;a href=&quot;https://vega.github.io/vega&quot;&gt;Vega&lt;/a&gt;&lt;/em&gt; waren die &lt;a href=&quot;https://altair-viz.github.io/gallery/index.html&quot;&gt;Beispiele&lt;/a&gt; sehr hilfreich, um einen Überblick über die Möglichkeiten zu bekommen. Ich bin nach wie vor begeistert, welche Vielzahl an Visualisierungen &lt;em&gt;Altair&lt;/em&gt; bietet. Insbesondere die Interaktivität hat mich zutiefst beeindruckt. Da können die bisher von mir verwendeten Tools wie &lt;a href=&quot;https://matplotlib.org/&quot;&gt;Matplotlib&lt;/a&gt; und &lt;a href=&quot;https://seaborn.pydata.org/&quot;&gt;seaborn&lt;/a&gt; nicht mithalten. Es hat mir viel Spaß gemacht, anhand der folgenden Corona-Grafik &lt;em&gt;Altair&lt;/em&gt; und &lt;em&gt;Vega&lt;/em&gt; kennenzulernen. Ein sehr strukturierter, überaus gelungener Zugang zum Thema Datenvisualisierung mit Python - und sicher nicht die letzte Grafik, die ich mit &lt;em&gt;Altair&lt;/em&gt; erstellt habe.&lt;/p&gt;

&lt;p&gt;Noch ganz kurz zur Grafik: Sie zeigt für die unterschiedlichen Länder die Entwicklung der Corona-Fälle, jeweils normiert bei einem Start von 100 Infizierten bzw. 10 Todesopfern. Die Grafik ist interaktiv, sprich man kann z.B. mit Mausover die einzelnen Länder auswählen oder die Achsen verschieben. Auf Handys funktioniert das leider nur sehr eingeschränkt, daher besser am Desktop damit spielen ;-)&lt;/p&gt;

&lt;div id=&quot;vis&quot;&gt;&lt;/div&gt;

&lt;script type=&quot;text/javascript&quot;&gt;
  var spec = &quot;https://raw.githubusercontent.com/Datenspieler/notebooks_for_blog/master/2020-corona/corona.json&quot;;
  vegaEmbed('#vis', spec).then(function(result) {
    // Access the Vega view instance (https://vega.github.io/vega/docs/api/view/) as result.view
  }).catch(console.error);
&lt;/script&gt;

&lt;h2 id=&quot;das-zugehörige-jupyter-notebook&quot;&gt;Das zugehörige Jupyter Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2020-corona/corona.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2020-corona/corona.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2020-corona/corona.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;</content><author><name></name></author><summary type="html">Unser aller Leben hat sich schlagartig geändert - Corona! In dem Zusammenhang gibt es natürlich eine Unmenge an Daten, die sich stündlich ändern. Keine Angst, ich will hier keine neue Informationsseite aufbauen, ich habe ein viel bescheideneres Ziel.</summary></entry><entry><title type="html">Ein kurzer Jahresrückblick via Twitter</title><link href="http://datenspieler.com/twitter-rueckblick/" rel="alternate" type="text/html" title="Ein kurzer Jahresrückblick via Twitter" /><published>2017-01-01T00:00:00+00:00</published><updated>2017-01-01T00:00:00+00:00</updated><id>http://datenspieler.com/twitter-rueckblick</id><content type="html" xml:base="http://datenspieler.com/twitter-rueckblick/">&lt;p&gt;Der Rest der Familie liegt dank Grippe krank im Bett, somit entfiel gestern die Silvesterfeier. Da ich mir eh schon länger anschauen wollte, was man mit den Twitter-Daten so alles machen kann, war rasch die Idee eines Jahresrückblicks via Twitter geboren.&lt;/p&gt;

&lt;p&gt;Allerdings folgte recht bald eine Enttäuschung - Twitter erlaubt es nur die letzten 3.200 Tweets abzufragen. Daraus lässt sich kein echter Jahresrückblick basteln. Aber es wird zumindest eine Übersicht über die vergangenen zwei Monate. Als Newsquellen, die fleißig twittern, habe ich mit &lt;a href=&quot;https://twitter.com/derStandard&quot; target=&quot;_blank&quot;&gt;@derStandardat&lt;/a&gt; und &lt;a href=&quot;https://twitter.com/KURIERat&quot; target=&quot;_blank&quot;&gt;@KURIERat&lt;/a&gt; zwei österrichische Medien gewählt. Beide twittern ungefähr gleich viel. Beim Standard bin ich mit den 3.200 Tweets bis Ende Oktober zurückgekommen. Daher habe ich mich in der Analyse auf November und Dezember 2016 beschränkt. Dazu habe ich dann noch aus Deutschland &lt;a href=&quot;https://twitter.com/SPIEGEL_Top&quot; target=&quot;_blank&quot;&gt;@SPIEGEL_Top&lt;/a&gt; mitaufgenommen und &lt;a href=&quot;https://twitter.com/ArminWolf&quot; target=&quot;_blank&quot;&gt;@ArminWolf&lt;/a&gt; als &lt;em&gt;die&lt;/em&gt; twitternde Privatperson in Österreich. Zeitpunkt der Datenabfrage war der 31.12.2016, gegen 22:30.&lt;/p&gt;

&lt;p&gt;Die Analyse unten ist recht kurz und rudimentär, freue mich schon, wenn ich mal Zeit habe da tiefer zu gehen, z. B. genauere Analysen der Follower, Timing der Hashtags.&lt;/p&gt;

&lt;h2 id=&quot;wer-twittert-wie-viel&quot;&gt;Wer twittert wie viel?&lt;/h2&gt;

&lt;p&gt;Schauen wir uns zuerst einmal die Anzahl der Follower an. Hier führt Armin Wolf. Spiegel Online Top und der Standard sind recht gleich auf, Kurier deutlich abgeschlagen. Es gibt übrigens auch das populärere Spiegel Online - ohne Top. Hier wurde aber so häufig getwittert, ds ein Vergleich nicht wirklich funktioniert hätte.&lt;/p&gt;

&lt;table class=&quot;center&quot;&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th style=&quot;text-align: left&quot;&gt;&lt;strong&gt;User&lt;/strong&gt;&lt;/th&gt;
      &lt;th style=&quot;text-align: right&quot;&gt;&lt;strong&gt;Followers&lt;/strong&gt;&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Armin Wolf&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;324k&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;SPIEGEL ONLINE Top&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;281k&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;derStandard.at&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;246k&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;KURIER&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;70k&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;Im betrachteten Zeitraum November und Dezember 2016 haben die einzelnen User rund zwei- bis dreitausend Mal getwittert, inkl. Retweets. In den folgenden Analysen ignoriere ich Tweets der Nachrichtenquellen, wenn es sich um Retweets handelt. Zusätzlich sieht man in der Tabelle, wie oft die Originaltweets der 4 User selbst reteeted wurden. Hier liegt Armin Wolf klar in Führung.&lt;/p&gt;

&lt;table class=&quot;center&quot;&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th style=&quot;text-align: left&quot;&gt;&lt;strong&gt;User&lt;/strong&gt;&lt;/th&gt;
      &lt;th style=&quot;text-align: right&quot;&gt;&lt;strong&gt;Tweets inkl. Retweets&lt;/strong&gt;&lt;/th&gt;
      &lt;th style=&quot;text-align: right&quot;&gt;&lt;strong&gt;Tweets exkl. Retweets&lt;/strong&gt;&lt;/th&gt;
      &lt;th style=&quot;text-align: right&quot;&gt;&lt;strong&gt;Retweets dieser Tweets&lt;/strong&gt;&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;derStandard.at&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;2.981&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;2.957&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;6.109&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;KURIER&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;2.583&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;2.520&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;4.712&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Armin Wolf&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;2.272&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;1.961&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;11.436&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;SPIEGEL ONLINE Top&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;1.791&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;1.791&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;3.839&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;h2 id=&quot;wann-wird-getwittert&quot;&gt;Wann wird getwittert?&lt;/h2&gt;

&lt;p&gt;Wenn man sich anschaut, wann getittert wird, erkennt man zum Beispiel die Präsidentenwahl in den USA sehr gut. An den anderen Tagen ging es kaum vor 5 Uhr los.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2017-twitter/tweets_pro_tag.png&quot; alt=&quot;Tweets pro Tag&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Bezüglich besonders populärer Tweets, sprich Tweets mit einer hohen Anzahl an Retweets, sticht ein Tweet mit rund 1.300 Retweets heraus. Der Tweet stammt von Armin Wolf und hat auch mit der US-Wahl zu tun.&lt;/p&gt;

&lt;blockquote class=&quot;twitter-tweet&quot; data-lang=&quot;en&quot;&gt;&lt;p lang=&quot;de&quot; dir=&quot;ltr&quot;&gt;Fidel Castros US-Präsidenten:&lt;br /&gt;Eisenhower&lt;br /&gt;Kennedy&lt;br /&gt;Johnson&lt;br /&gt;Nixon&lt;br /&gt;Ford&lt;br /&gt;Carter&lt;br /&gt;Reagan&lt;br /&gt;Bush sr.&lt;br /&gt;Clinton&lt;br /&gt;Bush jr.&lt;br /&gt;Obama.&lt;br /&gt;Trump war zu viel.&lt;/p&gt;&amp;mdash; Armin Wolf (@ArminWolf) &lt;a href=&quot;https://twitter.com/ArminWolf/status/802434099990462464&quot;&gt;November 26, 2016&lt;/a&gt;&lt;/blockquote&gt;
&lt;script async=&quot;&quot; src=&quot;//platform.twitter.com/widgets.js&quot; charset=&quot;utf-8&quot;&gt;&lt;/script&gt;

&lt;p&gt;Die zwei Graphiken unten zeigen die Verteilung der Tweets nach Retweets. So sieht man zum Beispiel, dass die meisten Tweets keine Retweets haben.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2017-twitter/retweets_hist_bis_50.png&quot; alt=&quot;Retweets bis&quot; /&gt;&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2017-twitter/retweets_hist_ab_50.png&quot; alt=&quot;Retweets ab 50&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;wer-twittert-am-meisten-am-wochenende&quot;&gt;Wer twittert am meisten am Wochenende?&lt;/h2&gt;

&lt;p&gt;Wie zu erwarten, wird am Wochenende weniger getwittert. Armin Wolf twittert am Sonntag recht fleißig, macht dafür am Samstag am konsequentesten Pause. Dafür ist bei ihm der Mittwoch der klare Twitter-Favorit. Spiegel Online Top ist am Freitag, vor dem Start ins Wochenende, besonders eifrig.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2017-twitter/tweets_pro_wochentag.png&quot; alt=&quot;Tweets pro Wochentag&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Ein Blick auf die Uhrzeit der Tweets zeigt, dass man beim Kurier und beim Standard recht klare ‘Arbeitszeiten’ des Twitter-Accounts sieht. Beim Kurier von 5 bis 21 Uhr, beim Standard von 7 bis 23 Uhr. Armin Wolf’s ‘Twitter-Arbeitstag’ beginnt noch später, dauert aber auch am längsten.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2017-twitter/tweets_pro_stunde.png&quot; alt=&quot;Tweets pro Stunde&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;wer-verwendet-welche-hashtags&quot;&gt;Wer verwendet welche Hashtags?&lt;/h2&gt;

&lt;p&gt;In den analysierten Tweets war #bpw16 der am häufigsten verwendete Hashtag, er wurde 146 mal verwendet. Es folgen #wirtschaft, #berlin, #wissenschaft und #trump.&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2017-twitter/hashtags.png&quot; alt=&quot;Hashtags&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Die Verwendung von Hashtags sind je User recht unterschiedlich. Der Standard verwendet die meisten Hashtags (rund 1.800), gefolgt von Kurier mit rund der Hälfte. Armin Wolf verwendet Hashtags recht sparsam, Spiegel Online hat nur ein Hashtag verwendet. Die folgenden Wordclouds mit Hashtags pro User beenden meine kurze Twitter ‘Jahresrückschau’.&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2017-twitter/hashtags_derStandard.at.png&quot; alt=&quot;Hashtags der Standard&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2017-twitter/hashtags_KURIER.png&quot; alt=&quot;Hashtags Kurier&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2017-twitter/hashtags_Armin_Wolf.png&quot; alt=&quot;Hashtags Armin Wolf&quot; /&gt;&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2017-twitter/hashtags_SPIEGEL_ONLINE_Top.png&quot; alt=&quot;Hashtags Spiegel Online&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;das-ipython-notebook&quot;&gt;Das IPython Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2017-twitter/twitter.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2017-twitter/twitter.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2017-twitter/twitter.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;</content><author><name></name></author><summary type="html">Der Rest der Familie liegt dank Grippe krank im Bett, somit entfiel gestern die Silvesterfeier. Da ich mir eh schon länger anschauen wollte, was man mit den Twitter-Daten so alles machen kann, war rasch die Idee eines Jahresrückblicks via Twitter geboren.</summary></entry><entry><title type="html">Gewinnt meine Tochter oder der Rabe?</title><link href="http://datenspieler.com/haba-obstgarten/" rel="alternate" type="text/html" title="Gewinnt meine Tochter oder der Rabe?" /><published>2016-11-21T00:00:00+00:00</published><updated>2016-11-21T00:00:00+00:00</updated><id>http://datenspieler.com/haba-obstgarten</id><content type="html" xml:base="http://datenspieler.com/haba-obstgarten/">&lt;p&gt;Ich habe eine kleine Tochter, die mit Begeisterung das Spiel Obstgarten von HABA spielt. Das Ergbenis ist entweder große Freude, wenn das Obst schnell genug geerntet wird, oder auch Tränen, wenn der böse Rabe gewinnt. Als besorgter Vater habe ich mich gefragt, wie wahrscheinlich es ist, dass das Kind nach dem Spiel glücklich ist.&lt;/p&gt;

&lt;h2 id=&quot;das-spiel-obstgarten&quot;&gt;Das Spiel Obstgarten&lt;/h2&gt;

&lt;p&gt;Von &lt;a href=&quot;https://www.haba.de&quot;&gt;HABA&lt;/a&gt; gibt es das tolle Spiel &lt;a href=&quot;https://www.haba.de/de_DE/spielzeug/obstgarten/p/1000017&quot;&gt;Obstgarten&lt;/a&gt;. &lt;a href=&quot;https://www.haba.de/de_DE/spielzeug/obstgarten/p/1000017&quot;&gt;&lt;img src=&quot;/images/2016-obstgarten/obstgarten.jpg&quot; alt=&quot;Bild Spiel Obstgarten, (C) Haba&quot; title=&quot;Copyright HABA&quot; /&gt;&lt;/a&gt; Dabei versucht man gemeinsam Obst von Bäumen zu ernten, und das schneller als der böse Rabe. Konkreter – die Spielanleitung findet man &lt;a href=&quot;http://www.haba.de/medias/sys_master/hcd/hdb/8802231812126.pdf&quot;&gt;hier&lt;/a&gt; – gibt es vier Obstbäume (Apfel, Birne, Kirsche, Zwetschke) mit je zehn Früchten. Zeigt der Würfel eine der vier Obstsorten, wird eine Frucht vom entsprechenden Baum geerntet, vorausgesetzt es hängen noch Früchte am Baum. Aber wehe, es wird der Rabe gewürfelt. Dann wird Schritt für Schritt ein Rabe zusammengepuzzelt. Insgesamt sind es neun Puzzleteile, die den Raben ergeben.&lt;/p&gt;

&lt;p&gt;Auf den ersten Blick sieht es also schlecht aus für die Spieler – 4 x 10 Früchte versus nur 9 Rabenteile. Aber zum Glück gibt es noch die sechste Würfelseite, ein Korb. Wird der gewürfelt, darf man zwei beliebige Früchte ernten. Aber reicht das, damit die spielenden Kinder, oder auch die Erwachsenen, eine gute Chance haben, als Sieger aus dem Spiel hervorzugehen?&lt;/p&gt;

&lt;p&gt;Pro Wurf werden im Durchschnitt 4 x 1/6 (ein Obst wird gewürfelt) + 2 x 1/6 (Korb wird gewürfelt) = 1 Obst entfernt und 1/6 Rabenteil aufgelegt. Somit hätte man im Durchschnitt also nach 40 Würfen die 40 Früchte geerntet und gleichzeitig 40/6 = 6.7 &amp;lt; 9 Rabenteile aufgelegt. Sieht also gut aus.&lt;/p&gt;

&lt;p&gt;Aber halt, hier hat sich ein Denkfehler eingeschlichen. Je länger das Spiel dauert, sprich je mehr Früchte geerntet sind, umso schwieriger wird es, weitere zu ernten. Sind zum Beispiel schon alle Äpfel geerntet, nützt ein gewürfelter Apfel nichts. So leicht, ist es also doch nicht.&lt;/p&gt;

&lt;p&gt;Was tun? Warum nicht den Computer fragen?&lt;/p&gt;

&lt;h2 id=&quot;computersimulation&quot;&gt;Computersimulation&lt;/h2&gt;

&lt;p&gt;Ich habe ein IPython Notebook erstellt, in dem die einzelnen Komponenten der Simulation Schritt für Schritt aufgebaut werden. Der komplizierteste Teil ist die Würfelseite Korb. Hier ist nämlich die einzige Stelle im Spiel, in dem der Spieler eine Entscheidung treffen muss, welche zwei Früchte er ernten möchte.&lt;/p&gt;

&lt;p&gt;Die offensichtlichste Strategie ist es, diejenigen Früchte zu ernten, von denen es noch am meisten gibt. Wenn man kurz darüber nachdenkt, erkennt man, dass das auch die optimale Strategie ist, unter der Annahme, dass der Würfel fair ist, sprich alle 6 Seiten gleich häufig auftreten. Dann ist nämlich zu erwarten, dass bei den kommenden Würfen im Durchschnitt die Früchte gleich oft gewürfelt werden. Ich nenne diese Strategie im folgenden &lt;em&gt;max&lt;/em&gt;.&lt;/p&gt;

&lt;p&gt;Praktische Erfahrung zeigt, dass meine Tochter oft eine andere Strategie verfolgt, und genau die Früchte erntet, von denen es nur mehr wenige gibt. Hier scheint der Wunsch doch noch einen Apfel zu erntet im Vordergrund zu stehen. Diese Strategie ist leider, wenn man vor dem Raben die Früchte ernten will, die schlechteste, deshalb &lt;em&gt;min&lt;/em&gt; im weiteren genannt. Als dritte Strategie habe ich noch die Zufallsstrategie &lt;em&gt;rnd&lt;/em&gt; implementiert, hier wird rein zufällig eine Obstsorte ausgewählt.&lt;/p&gt;

&lt;h2 id=&quot;das-ipython-notebook&quot;&gt;Das IPython Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2016-obstgarten/Haba-Obstgarten.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2016-obstgarten/Haba-Obstgarten.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2016-obstgarten/Haba-Obstgarten.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;ergebnisse&quot;&gt;Ergebnisse&lt;/h2&gt;

&lt;p&gt;Die wichtigste Frage ist natürlich, wie wahrscheinlich gewinnen die Spieler gegen den Raben.
&lt;img src=&quot;/images/2016-obstgarten/01_gewinnwahrscheinlichkeit.svg&quot; alt=&quot;Gewinnwahrscheinlichkeit&quot; /&gt; Wie man sieht, hängt das deutlich von der Strategie ab. Wenn man die optimale Strategie &lt;em&gt;max&lt;/em&gt; wählt, gewinnt man mit rund 69%. Wählt man hingehgen die schlechteste Strategie &lt;em&gt;min&lt;/em&gt;, gewinnt man nur mit rund 53%. Die Zufallsstrategie liegt wie erwartet dazwischen.&lt;/p&gt;

&lt;p&gt;Die nächste Frage, wie viele Runden spielt man.
&lt;img src=&quot;/images/2016-obstgarten/02_gespielte_runden.svg&quot; alt=&quot;Anzahl gespielter Runden&quot; /&gt;
Auch das hängt von der Strategie ab, zwischen rund 40 und 44 Runden. Wenn man eine schlechtere Strategie wählt, spielt man länger.&lt;/p&gt;

&lt;p&gt;Interessant auch, wenn man unterscheidet, wie das Spiel ausgeht. Hier sieht man, dass die gewonnenen Spiele im Schnitt etwas länger dauern. Für die Strategie &lt;em&gt;max&lt;/em&gt; spielt man zum Beispiel nur 37 Runden, wenn der Rabe gewinnt, gegenüber 41 Runden, wenn die Spieler gewinnen.
&lt;img src=&quot;/images/2016-obstgarten/03_gespielte_runden_je_ergebnis.svg&quot; alt=&quot;&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Wie sehr muss man zittern, wenn man gewinnt, sprich wird es knapp, sind zum Beispiel schon 8 Rabenteile ausgelegt? Wenn man mit der Strategie &lt;em&gt;max&lt;/em&gt; gewinnt, ist es am wahrscheinlichsten, dass 6 Rabenteile ausgelegt sind.
&lt;img src=&quot;/images/2016-obstgarten/04_verteilung_punkte_strategie_max.svg&quot; alt=&quot;Details Ergebnis&quot; /&gt;
Die Zahlen auf der horizontalen Achse sind wie folgt zu verstehen: eine positive Zahl gibt an, wieviele Rabenteile noch fehlen, bis der Rabe fertig ist. 4 bedeutet also, dass noch 4 Rabenteile fehlen und folglich 5 Teile ausgelegt sind. Eine negative Zahl gibt an, wieviele Früchte noch zu ernten sind.&lt;/p&gt;

&lt;p&gt;Hier noch die Details der Ergebnisse je Strategie.
&lt;img src=&quot;/images/2016-obstgarten/05_verteilung_punkte_je_strategie.svg&quot; alt=&quot;Details Ergebnis pro Strategie&quot; /&gt;&lt;/p&gt;</content><author><name></name></author><summary type="html">Ich habe eine kleine Tochter, die mit Begeisterung das Spiel Obstgarten von HABA spielt. Das Ergbenis ist entweder große Freude, wenn das Obst schnell genug geerntet wird, oder auch Tränen, wenn der böse Rabe gewinnt. Als besorgter Vater habe ich mich gefragt, wie wahrscheinlich es ist, dass das Kind nach dem Spiel glücklich ist.</summary></entry><entry><title type="html">Auf ein Wort in Österreichs Parlament! Teil 2</title><link href="http://datenspieler.com/parlament-zahlen/" rel="alternate" type="text/html" title="Auf ein Wort in Österreichs Parlament! Teil 2" /><published>2016-11-18T00:00:00+00:00</published><updated>2016-11-18T00:00:00+00:00</updated><id>http://datenspieler.com/parlament-zahlen</id><content type="html" xml:base="http://datenspieler.com/parlament-zahlen/">&lt;p&gt;In der Fortsetzung des &lt;a href=&quot;/parlament-wortwolke/&quot;&gt;Artikels&lt;/a&gt; über die Nationalratssitzungen im österreichischen Parlament werde ich anhand von mehr als 30.000 Reden unter anderem folgende Fragen beantworten: Reden weibliche Abgeordnete oder männliche Abgeordnete mehr? Welche Partei hält im Durchschnitt die längsten Reden? An welchem Wochentag und in welchem Monat werden die meisten Reden gehalten?&lt;/p&gt;

&lt;h2 id=&quot;wann-werden-die-reden-im-parlament-gehalten&quot;&gt;Wann werden die Reden im Parlament gehalten?&lt;/h2&gt;

&lt;p class=&quot;center&quot;&gt;Die Daten enthalten Reden aus den Jahren 2006 bis 2016, wobei das erste und das letzte Jahr nur teilweise abgedeckt sind. Wie man sieht, waren die Parlamentarier im Jahr 2009 besonders eifrig mit rund 4.300 Reden, ansonsten gab es zwischen 2.700 und 3.600 Reden.
&lt;img src=&quot;/images/2016-parlament/reden_pro_jahr.svg&quot; alt=&quot;Reden pro Jahr&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Die Reden verteilen sich nicht gleichmäßig über das Jahr. Im August gibt es eine Sommerpause, dafür gibt es im Juli überdurchschnittlich viele Reden. Nach der Sommerpause beginnt man etwas zögerlich im September, steigert sich dann aber kontinuierlich bis zum Dezember. Die Parlamentarier scheinen auch im Februar recht konsequent Semesterferien zu machen.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/reden_pro_monat.svg&quot; alt=&quot;Reden pro Monat&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Ein Blick auf die Verteilung der Reden auf die Wochentage zeigt, dass es am Montag so gut wie keine Sitzungen gab. Mittwoch und Donnerstag sind die typischen Sitzungstage. Und es gab auch einige Sitzungen am Samstag. Hier ein kleines Detail aus der Datenanalyse: es gab Sitzungen, die mehrere Tage dauerten. Hier habe ich alle Reden dem letzten Tag zugeordnet. Sprich, manche der in der Grafik unten dargestellten Reden am Samstag könnten theoretisch auch am Freitag stattgefunden haben.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/reden_pro_wochentag.svg&quot; alt=&quot;Reden pro Wochentag&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Ein paar weitere Details: Mai 2009 war der Monat, mit den am Abstand meisten Reden. Im August gab es nur Reden im Jahr 2010.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/reden_pro_jahr_monat.svg&quot; alt=&quot;Reden pro Jahr und Monat&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2007 bis 2009 war Donnerstag der Tag mit den meisten Reden. Mittwoch im Jahr 2010 war der Wochentag mit den meisten Reden. 2014 und 2015 gab es dann auch deutlich mehr Reden am Mittwoch als am Donnerstag.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/reden_pro_wochentag_jahr.svg&quot; alt=&quot;Reden pro Wochentag und Jahr&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;wer-spricht-im-parlament&quot;&gt;Wer spricht im Parlament?&lt;/h2&gt;

&lt;p&gt;Die Daten enthalten pro Rede den Redner, inklusive “Berufsbezeichnung”. Das ist meistens Abgeordneter bzw. Abgeordnete, aber auch weitere wie die einzelnen Bundesminister, -ministerinnen, Bundeskanzler, Präsident, …. Insgesamt gibt es fast 70 Berufsbezeichnungen, hier die 7 mit mehr als 100 Reden.&lt;/p&gt;

&lt;table class=&quot;center&quot;&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th style=&quot;text-align: left&quot;&gt;&lt;strong&gt;Bezeichnung&lt;/strong&gt;&lt;/th&gt;
      &lt;th style=&quot;text-align: right&quot;&gt;&lt;strong&gt;Anzahl&lt;/strong&gt;&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Abgeordneter&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;20.803&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Abgeordnete&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;7.968&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesminister für Arbeit, Soziales und Konsumentenschutz&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;161&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesminister für Land- und Forstwirtschaft, Umwelt und Wasserwirtschaft&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;154&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundeskanzler&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;125&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesministerin für Justiz&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;104&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Staatssekretär im Bundesministerium für Finanzen&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;104&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;Das Thema Kultur wurde zum Beispiel in 4 unterschiedlich benannten Ministerien behandelt:&lt;/p&gt;

&lt;table class=&quot;center&quot;&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th style=&quot;text-align: left&quot;&gt;&lt;strong&gt;Bezeichnung&lt;/strong&gt;&lt;/th&gt;
      &lt;th style=&quot;text-align: right&quot;&gt;&lt;strong&gt;Anzahl&lt;/strong&gt;&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesministerin für Bildung, Wissenschaft und Kultur (2007)&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;1&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesministerin für Unterricht, Kunst und Kultur (2007 - 2014)&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;88&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesminister für Kunst und Kultur, Verfassung und öffentlichen Dienst (2014)&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;3&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td style=&quot;text-align: left&quot;&gt;Bundesminister für Kunst und Kultur, Verfassung und Medien (2014 - 2015)&lt;/td&gt;
      &lt;td style=&quot;text-align: right&quot;&gt;18&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;Anhand der Bezeichnung Abgeordnete und Abgeordnete, kann man das Verhältnis von Reden weiblicher zu Reden männlichen Abgeordneter ermitteln. Über den gesamten untersuchten Zeitraum kommen auf 100 Reden von männlichen Abgeordneten 38 Reden weiblicher Abgeordneter. Die Grafik unten zeigt, dass es hier keinen klaren Trend innerhalb der letzten Jahre gibt.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/geschlecht.svg&quot; alt=&quot;Geschlecht&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;welche-partei-hält-wie-viele-reden&quot;&gt;Welche Partei hält wie viele Reden?&lt;/h2&gt;

&lt;p&gt;Die Daten enthalten für die Abgeordneten auch die Partei. Regierungsmitglieder sind auch gesondert ausgewiesen. In den folgenden Analysen habe ich &lt;em&gt;NEOS&lt;/em&gt; und &lt;em&gt;NEOS-LIF&lt;/em&gt; gemeinsam als &lt;em&gt;NEOS&lt;/em&gt; behandelt. Zusätzlich habe ich &lt;em&gt;ohne Klubzugehörigkeit&lt;/em&gt; und &lt;em&gt;Andere&lt;/em&gt; (zum Beispiel Präsident des Rechnungshofes, Volksanwältin) zu &lt;em&gt;Andere&lt;/em&gt; zusammengefasst.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/reden_pro_partei.svg&quot; alt=&quot;Reden pro Partei&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Man sieht, dass die SPÖ die meisten Reden gehalten hat, gefolgt von ÖVP, FPÖ, Grünen. Interessanter vielleicht, wie sich die prozentuelle Verteilung der Reden pro Partei über die Zeit verändert hat.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/reden_pro_partei_pro_jahr.svg&quot; alt=&quot;Reden pro Partei je Jahr&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2008 kamen die meisten Reden von Abgeordneten der ÖVP. BZÖ lag teilweise vor den Grünen. NEOS und Team Stronach sind gleich auf. Und die Regierung hält recht konstant gut 5 % der Reden.&lt;/p&gt;

&lt;p&gt;Wir haben vorher gesehen, dass auf 100 Reden von männlichen abgeordneten, 38 von weiblichen Abgeordneten kommen. Da stellt sich natürlich die Frage, ob es hier Unterschiede pro Partei gibt oder Änderungen in dem Verhältnis über die Zeit.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/geschlecht_je_partei.svg&quot; alt=&quot;Verhältnis Geschlecht pro Partei je Jahr&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Einzig um Jahr 2015 gab es bei den Grünen mehr Reden von weiblichen als von männlichen Abgeordneten. An zweiter Stelle bzgl. relativer Reden weiblicher Abgeordneter ist in den letzten Jahren das Team Stronach. SPÖ und ÖVP sind dann recht nahe beisammen, gefolgt von FPÖ, wobei der Anteil weiblicher Reden bei der SPÖ in den letzten Jahren abgenommen hat, bei der FPÖ zugenommen. NEOS wurden in den letzten Jahren zum Schlusslicht.&lt;/p&gt;

&lt;h2 id=&quot;wie-lange-sind-die-reden&quot;&gt;Wie lange sind die Reden?&lt;/h2&gt;

&lt;p&gt;Da die Daten auch den Text der Reden enthalten, können wir natürlich die Anzahl der Worte pro Rede benutzen, um die Länge der Reden zu analysieren. Man sieht, dass die durchschnittliche Rede rund 600 Wörter enthält, ziemlich konstant über die Jahre.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/woerter_pro_rede_je_jahr.svg&quot; alt=&quot;Wörter pro Rede je Jahr&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Jetzt ist es natürlich spannend, ob es hier Unterschiede bei den Parteien gibt, sprich welche Partei hält die längsten Reden.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/woerter_pro_rede_je_partei.svg&quot; alt=&quot;Wörter pro Rede je Partei&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Man sieht, dass die Regierungsvertreter die längsten Reden halten, die Abgeordneten von SPÖ und ÖVP die durchschnittlich kürzesten. Die anderen Parteien sind ziemlich gleichauf. Wenn man sich nun die Verteilung der Wörter pro Partei ansieht, stellt man fest, dass sich die durchschnittlich kürzeren Reden von SPÖ und ÖVP mit der höheren Anzahl an Reden von SPÖ und ÖVP gut aufheben. Sprich SPÖ, ÖVP, FPÖ und Grüne haben über den gesamten Zeitraum von 2006 bis 2016 einen sehr ähnlichen Anteil an Wörtern im Nationalrat.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/woerter_pro_partei_je_jahr.svg&quot; alt=&quot;Wörter pro Partei je Jahr&quot; /&gt;&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;Die Analyse unten zeigt, dass die Reden an Montagen am längsten sind. Im Verlauf der Woche werden die Reden dann kürzer.
&lt;img src=&quot;/images/2016-parlament/woerter_pro_wochentag.svg&quot; alt=&quot;Wörter pro Wochentag&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Und die folgende Grafik räumt mit dem Vorurteil auf, dass Frauen mehr reden als Männer. Quer durch die Parteien, mit Ausnahme von NEOS, haben die Reden männlicher Abgeordneter mehr Wörter als die von weiblichen.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/woerter_pro_geschlecht_je_partei.svg&quot; alt=&quot;Wörter pro Rede je Jahr&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;welche-daten-wurden-genau-verwendet&quot;&gt;Welche Daten wurden genau verwendet?&lt;/h2&gt;

&lt;p&gt;Auf der Suche nach interessanten frei zugänglichen Daten, mit denen ich spielen kann, bin ich vor einiger Zeit auf der Seite des österreichischen &lt;a href=&quot;https://www.parlament.gv.at/&quot; target=&quot;_blank&quot;&gt;Parlament&lt;/a&gt; gelandet. Sehr zu meiner Freude gibt es dort sogar einen Abschnitt mit dem Titel &lt;a href=&quot;https://www.parlament.gv.at/SERV/OGD/&quot;&gt;&lt;em&gt;Open Government Data&lt;/em&gt;&lt;/a&gt;. Die unter dem Titel zur Verfügung gestellte Daten sind dann allerdings doch etwas enttäuschend, da hier zwar eine strukturierte Liste der Reden, aber nicht die Reden selbst angeboten werden. Bei genauerer Betrachtung stellt sich aber heraus, dass ab der 150. Nationalratssitzung der XXII. Gesetzgebungsperiode die &lt;a href=&quot;https://www.parlament.gv.at/PAKT/STPROT/index.shtml?SUCH=&amp;amp;xdocumentUri=%2FPAKT%2FSTPROT%2Findex.shtml&amp;amp;pageNumber=1&amp;amp;anwenden=Anwenden&amp;amp;R_PLSO=PL&amp;amp;GP=XXII&amp;amp;STEP=&amp;amp;INTRANET=N&amp;amp;STPROT=ALLE&amp;amp;FBEZ=FP_011&amp;amp;NRBRBV=NR&amp;amp;jsMode=&amp;amp;requestId=632ABBFC42&amp;amp;BEZ=FP_211&amp;amp;LISTE=&amp;amp;NUR_VORL=N&amp;amp;listeId=211&quot; target=&quot;_blank&quot;&gt;stenographischen Protokolle&lt;/a&gt; in einem strukturierten HTML Format vorliegen.&lt;/p&gt;

&lt;p&gt;Langer Reder, kurzer Sinn, ich habe also die zum 8.8.2016 verfügbaren &lt;em&gt;stenographischen Protokolle&lt;/em&gt; der Plenarsitzungen des Nationalrats der XXIII., XXIV. und XXV. Gesetzgebungsperioden (bis inklusive 24.02.2016) heruntergeladen und dann mittels der tollen Python Bibliothek &lt;a href=&quot;https://www.crummy.com/software/BeautifulSoup/bs4/doc/&quot; target=&quot;_blank&quot;&gt;BeautifulSoup&lt;/a&gt; analysiert. Im unten angeführten Sourcecode sieht man, dass das recht mühsam war, da die Dateien nicht gar so gut strukturiert sind und ich recht oft für Sonderfälle/Fehler korrigieren musste. Das ist mir sicher nicht immer zu 100 % gelungen, aber es ging mir hier ja um das Spielen mit Daten, nicht darum jedes kleinste Detail genau zu erfassen. Insgesamt hatte ich &lt;strong&gt;409 Sitzungen&lt;/strong&gt; mit &lt;strong&gt;30.820 Reden&lt;/strong&gt; zum Spielen zur Verfügung.&lt;/p&gt;

&lt;h2 id=&quot;das-ipython-notebook&quot;&gt;Das IPython Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2016-parlament/parlament.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2016-parlament/parlament.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2016-parlament/parlament.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;</content><author><name></name></author><summary type="html">In der Fortsetzung des Artikels über die Nationalratssitzungen im österreichischen Parlament werde ich anhand von mehr als 30.000 Reden unter anderem folgende Fragen beantworten: Reden weibliche Abgeordnete oder männliche Abgeordnete mehr? Welche Partei hält im Durchschnitt die längsten Reden? An welchem Wochentag und in welchem Monat werden die meisten Reden gehalten?</summary></entry><entry><title type="html">Auf ein Wort! Österreichs Parlament am Prüfstand</title><link href="http://datenspieler.com/parlament-wortwolke/" rel="alternate" type="text/html" title="Auf ein Wort! Österreichs Parlament am Prüfstand" /><published>2016-11-06T00:00:00+00:00</published><updated>2016-11-06T00:00:00+00:00</updated><id>http://datenspieler.com/parlament-wortwolke</id><content type="html" xml:base="http://datenspieler.com/parlament-wortwolke/">&lt;p&gt;Wer führt im österreichischen Parlament eigentlich das große Wort? Wer hingegen macht nicht viele Worte? Oder ist sowieso alles nur Wortklauberei? Dass sich auch in politischen Reden eine ganze Menge Daten verstecken, zeigt dieses Beispiel. Denn mithilfe von mehr als 30.000 Reden aus den Nationalratssitzungen lassen sich frei von jedem ideologischen Inhalt viele objektive Fakten herausfiltern. So können dank frei zugänglicher Daten und einem Meer von Wörtern einige interessante Fragen beantwortet werden: Reden weibliche Abgeordnete oder männliche Abgeordnete mehr? Welche Partei hält im Durchschnitt die längsten Reden? Welche Themen haben die einzelnen Jahre beherrscht?&lt;/p&gt;

&lt;h2 id=&quot;welche-wörter-kommen-in-den-reden-vor&quot;&gt;Welche Wörter kommen in den Reden vor?&lt;/h2&gt;

&lt;p&gt;Bevor ich diese Frage beantworte, ein paar Sätze zu den Daten, auf denen die Analysen hier beruhen. Ich konnte die &lt;em&gt;stenographischen Protokolle&lt;/em&gt; der Plenarsitzungen des österreichischen Nationalrats der XXIII., XXIV. und XXV. Gesetzgebungsperioden (bis inklusive 24.02.2016) herunterladen und so für die Auswertung aufbereiten, dass mir &lt;strong&gt;30.820 Reden&lt;/strong&gt; aus &lt;strong&gt;409 Sitzungen&lt;/strong&gt; für das Datenspielen zur Verfügung standen. Noch ein kleiner Disclaimer: Ich lasse nur die Daten sprechen. Wer von den Politikern dann auch wirklich zu seinem Wort steht, ist nicht Teil dieser Analyse ;-)&lt;/p&gt;

&lt;p&gt;Worum geht es eigentlich im Nationalrat? Einen ersten Überblick bekommt man mittels einer Wortwolke. Sie zeigt die am öftesten vorkommenden Wörter aus allen Reden.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_gesamt.png&quot; alt=&quot;Wordcloud&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Als nächsten Schritt die Themen im Laufe der Zeit: Dazu im Folgenden nun Wortwolken, die jeweils die Wörter hervorheben, die im entsprechenden Jahr überproportional oft – im Vergleich zu den anderen Jahren – vorkommen.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2007.png&quot; alt=&quot;Wordcloud_2007&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2007 und 2008 waren 2 der 3 Nationalratspräsidenten weiblich, ab Oktober 2008 waren dann 2 männlich. Daher findet man &lt;em&gt;Präsidentin&lt;/em&gt; überdurchschnittlich of in 2007 und 2008. Ebenfalls 2008 wurde Alfred &lt;em&gt;Gusenbauer&lt;/em&gt; von Werner &lt;em&gt;Faymann&lt;/em&gt; abgelöst, was man auch gut erkennt. 2008 wurde zum Beispiel auch die EU &lt;em&gt;Volksabstimmung&lt;/em&gt; diskutiert.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2008.png&quot; alt=&quot;Wordcloud_2008&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2009 befasst sich das Parlament zum Beispiel mit der &lt;em&gt;Wirtschaftskrise&lt;/em&gt;, oder auch nur &lt;em&gt;Krise&lt;/em&gt;.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2009.png&quot; alt=&quot;Wordcloud_2009&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2010 thematisiert der Nationalrat insbesondere den &lt;em&gt;Finanzminister&lt;/em&gt; mit das &lt;em&gt;Budget&lt;/em&gt;. Das Thema &lt;em&gt;Griechenland&lt;/em&gt; beginnt.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2010.png&quot; alt=&quot;Wordcloud_2010&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2011 sind &lt;em&gt;Griechenland&lt;/em&gt;, &lt;em&gt;Schulden&lt;/em&gt; und &lt;em&gt;Schuldenbremse&lt;/em&gt; große Themen, es geht dabei um &lt;em&gt;Milliarden&lt;/em&gt;. Die Diskussion zur &lt;em&gt;Wehrpflicht&lt;/em&gt; beginnt.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2011.png&quot; alt=&quot;Wordcloud_2011&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2012 dominiert der &lt;em&gt;Untersuchungsausschuss&lt;/em&gt; zur Klärung von Korruptionsvorwürfen. Und man spricht über den Europäischen Stabilitätsmechanismus, kurz &lt;em&gt;ESM&lt;/em&gt;.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2012.png&quot; alt=&quot;Wordcloud_2012&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2013 findet die Landtagswahl in &lt;em&gt;Niederösterreich&lt;/em&gt; statt. Die Krise in &lt;em&gt;Zypern&lt;/em&gt; ist ebenso Thema wie der &lt;em&gt;Rechnungshof&lt;/em&gt;, ein &lt;em&gt;Spekulationsverbot&lt;/em&gt; und das Team, bzw. die Person &lt;em&gt;Stronach&lt;/em&gt;. Und die Probleme mit der &lt;em&gt;Hypo&lt;/em&gt; &lt;em&gt;Bank&lt;/em&gt; beginnen.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2013.png&quot; alt=&quot;Wordcloud_2013&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2014 steht im Zeichen der &lt;em&gt;Insolvenz&lt;/em&gt; der &lt;em&gt;Hypo&lt;/em&gt; &lt;em&gt;AlpeAdria&lt;/em&gt; in &lt;em&gt;Kärnten&lt;/em&gt;, die dem &lt;em&gt;Steuerzahler&lt;/em&gt; &lt;em&gt;Milliarden&lt;/em&gt; kostet. Die &lt;em&gt;NEOS&lt;/em&gt; treten in Erscheinung, und international steht die &lt;em&gt;Ukraine&lt;/em&gt; im Fokus.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_jahr_2014.png&quot; alt=&quot;Wordcloud_2014&quot; /&gt;&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;em&gt;Flüchtlinge&lt;/em&gt; sind ein dominierendes Thema in 2015, und das Thema &lt;em&gt;Steuerreform&lt;/em&gt; wird diskutiert.
&lt;img src=&quot;/images/2016-parlament/wc_jahr_2015.png&quot; alt=&quot;Wordcloud_2015&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Die folgende Grafik zeigt, wie oft ausgewählte Wörter im Nationalrat über die Jahre hinweg verwendet werden. Im ersten Abschnitt sieht man die Wörter, die bereits oben bei den Wortwolken erwähnt wurden. Interessant vielleicht, dass das Thema &lt;em&gt;Steuerreform&lt;/em&gt; 2007 bis 2009 bereits Thema war, dann war Funkstille, seit 2014 ist es nun wieder Thema.
Dass Österreich in den Jahren 2011 bis 2013 eine &lt;em&gt;Finanzministerin&lt;/em&gt; hatte, sieht man ebenso deutlich, wie den Wechsel an der SPÖ-Spitze und die Entwicklung der Parteien &lt;em&gt;BZÖ&lt;/em&gt;, &lt;em&gt;Stronach&lt;/em&gt; und &lt;em&gt;NEOS&lt;/em&gt;.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;a href=&quot;/images/2016-parlament/wc_jahr_woerter.svg&quot; target=&quot;_blank&quot;&gt;
&lt;img src=&quot;/images/2016-parlament/wc_jahr_woerter.svg&quot; alt=&quot;Wörter pro Jahr&quot; /&gt;
&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Eine andere Frage, die man anhand der Daten betrachten kann, ist, worüber welche Partei spricht. Für die Analysen unten habe ich neben den Parteien SPÖ, ÖVP, FPÖ und Grüne auch die Minister und Ministerinnen der Regierung erfasst. Beginnen wir mit einem kleinen Rästel. Die Wortwolken unten zeigen pro Partei die Wörter, die von dieser Partei überdurchschnittlich (Wortwolke links) sowie unterdurchschnittlich (Wortwolke rechts) verwendet werden. Allerdings sind die Parteien mit Partei A, B, C, D und E anonoymisiert. Die Auflösung findet sich am Ende des Blogbeitrags.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_raetsel_Partei_A.png&quot; alt=&quot;Wortwolke Rätsel Partei A&quot; /&gt;
&lt;img src=&quot;/images/2016-parlament/wc_raetsel_Partei_B.png&quot; alt=&quot;Wortwolke Rätsel Partei B&quot; /&gt;
&lt;img src=&quot;/images/2016-parlament/wc_raetsel_Partei_C.png&quot; alt=&quot;Wortwolke Rätsel Partei C&quot; /&gt;
&lt;img src=&quot;/images/2016-parlament/wc_raetsel_Partei_D.png&quot; alt=&quot;Wortwolke Rätsel Partei D&quot; /&gt;
&lt;img src=&quot;/images/2016-parlament/wc_raetsel_Partei_E.png&quot; alt=&quot;Wortwolke Rätsel Partei E&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Nun noch ein paar Analysen zum Thema Wörter pro Partei. Die Grafik unten zeigt, dass die FPÖ am meisten über sich selbst und die Grünen am meisten über die ÖVP sprechen. Die Regierungsvertreter reden relativ wenig über die einzelnen Parteien, am seltensten wird die SPÖ erwähnt.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_parteien.svg&quot; alt=&quot;Parteiwörter je Partei&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Interessant auch, welche Parteien gewisse Wörter mehr oder weniger verwenden. &lt;em&gt;Österreich&lt;/em&gt; wird von allen Parteien oft wendet, am meisten von der Regierung. &lt;em&gt;Europa&lt;/em&gt; wird deutlich weniger oft erwähnt, am seltesten von FPÖ und Grünen. Die Regierung und die Grünen verwenden &lt;em&gt;Fragen&lt;/em&gt; am häufigsten. &lt;em&gt;Millionen&lt;/em&gt; werden von allen Parteien verwendet, &lt;em&gt;Milliarden&lt;/em&gt; am häufigsten von der Regierung und von der FPÖ. SPÖ und ÖVP sprechen am öftesten von Kollegen. FPÖ und Grüne verwenden die Wörter &lt;em&gt;Antrag&lt;/em&gt;, &lt;em&gt;sagen&lt;/em&gt;, &lt;em&gt;genau&lt;/em&gt; und &lt;em&gt;wissen&lt;/em&gt; öfter als die Regierung, SPÖ und ÖVP.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-parlament/wc_partei_woerter.svg&quot; alt=&quot;Wörter je Partei&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Im nächsten &lt;a href=&quot;/parlament-zahlen/&quot;&gt;Beitrag&lt;/a&gt; werde ich die Daten aus dem Nationalrat weiter analysieren und endlich die Frage beantworten, ob männliche oder weibliche Abgeordnete die längeren Reden halten. Oder auch, in welchem Monat und an welchem Wochentag die meisten Reden gehalten werden.&lt;/p&gt;

&lt;p&gt;&lt;em&gt;Auflösung des Parteien Wortwolken Rätsels&lt;/em&gt;
Regierung: Partei D, SPÖ : Partei A, ÖVP : Partei E, FPÖ : Partei C, Grüne : Partei B.&lt;/p&gt;</content><author><name></name></author><summary type="html">Wer führt im österreichischen Parlament eigentlich das große Wort? Wer hingegen macht nicht viele Worte? Oder ist sowieso alles nur Wortklauberei? Dass sich auch in politischen Reden eine ganze Menge Daten verstecken, zeigt dieses Beispiel. Denn mithilfe von mehr als 30.000 Reden aus den Nationalratssitzungen lassen sich frei von jedem ideologischen Inhalt viele objektive Fakten herausfiltern. So können dank frei zugänglicher Daten und einem Meer von Wörtern einige interessante Fragen beantwortet werden: Reden weibliche Abgeordnete oder männliche Abgeordnete mehr? Welche Partei hält im Durchschnitt die längsten Reden? Welche Themen haben die einzelnen Jahre beherrscht?</summary></entry><entry><title type="html">Worum geht es hier?</title><link href="http://datenspieler.com/hintergrund/" rel="alternate" type="text/html" title="Worum geht es hier?" /><published>2016-07-04T00:00:00+00:00</published><updated>2016-07-04T00:00:00+00:00</updated><id>http://datenspieler.com/hintergrund</id><content type="html" xml:base="http://datenspieler.com/hintergrund/">&lt;p&gt;&lt;em&gt;Noch&lt;/em&gt; ein Blog mehr im Internet… Wozu? – Um mit Daten zu spielen! Wir alle schwimmen in einem Meer an Daten: Wörtern, Bildern, Zahlen, Wahrscheinlichkeiten und unnützem Wissen. Wir leben in einer Zeit, in der eine unglaubliche Menge an Daten jeden Augenblick erzeugt wird. Ich will zeigen, wie einfach es ist, diese Daten in spannende Informationen zu verwandeln. Ich jongliere mit ihnen, experimentiere und analysiere sie. Und ich möchte möglichst vielen Lust machen, es mir gleichzutun.&lt;/p&gt;

&lt;h2 id=&quot;wie-soll-das-funktionieren&quot;&gt;Wie soll das funktionieren?&lt;/h2&gt;

&lt;p&gt;Für viele wahrscheinlich schockierend: Ich habe den Mathematikunterricht in der Schule geliebt. Da bin ich wohl eine Ausnahme, weil viele niemals mit den spannenden konkreten Anwendungen in Berührung kommen. Die theoretische Mathematik aus dem Schulunterricht bietet oft einen sehr trockenen und schwierigen Zugang und sogar ich muss zugeben, dass ich kaum etwas Konkretes vom Mathematikunterricht nach der Volksschule (Addieren, Multiplizieren und Co muss natürlich schon sein) heute in meinem Leben anwende. Ich bin jedoch gleichzeitig überzeugt, dass abstraktes Denken, wie man es zum Beispiel bei Kurvendiskussionen und beim Integrieren lernt, eine extrem wichtige Fähigkeit ist. Ich will zeigen, dass man beides verbinden kann – abstraktes Denken und konkrete Anwendungen. Vor dem Hintergrund würde es mich freuen, wenn meine Kinder in der Schule nicht wie ich eine Mathematik-Fachbereichsarbeit über kubische Gleichungen schreiben (was mir unglaublich Spaß gemacht hat, aber wie gesagt – eher die Ausnahme), sondern die Fähigkeit erlernen, mit Daten umzugehen.&lt;/p&gt;

&lt;p&gt;Wenn man am Computer mit Daten und Zahlen zu tun hat, macht man das wahrscheinlich mit Excel. Oft ist das genau das richtige Werkzeug. Allerdings ist man stark im Denken in Tabellen gefangen. Mir persönlich gefällt an Excel nicht, dass man zwar das Ergebnis präsentiert, aber der Weg dorthin meist versteckt ist. Der “Lösungsweg” ist in fertigen Formeln verpackt, die weder ersichtlich noch gut lesbar sind. Und falls es ein komplizierteres Excel mit Visual Basic Code ist, ist dieser auch versteckt.&lt;/p&gt;

&lt;p&gt;Außerdem gibt es für das Arbeiten mit Daten am Computer eine Unzahl an Programmiersprachen. Damit kann man dann, vorausgesetzt die Programmiersprache ist mächtig genug, fast alles machen. Nur ist das im Normalfall deutlich komplizierter und der “Lösungsweg” ist noch besser versteckt.&lt;/p&gt;

&lt;p&gt;Aber es gibt noch eine andere Möglichkeit, die ich hier in diesem Blog vorstellen will. Es ist eine Mischung aus dem einfachen Zugang via Excel und der unbegrenzten Möglichkeiten einer Programmiersprache, die gleichzeitig den Lösungsweg in den Mittelpunkt stellt. Man sieht klar, wie man zu den Ergebnissen kommt. Und das ist das Wesentliche, wenn man zum Mitmachen motivieren will – worum es mir hier ja geht. Denn nur wenn man versteht, wie man zu einem Ergebnis gekommen ist, kann man darauf basierend selbst mit Daten spielen und so neue Ergebnisse erzeugen.&lt;/p&gt;

&lt;h2 id=&quot;was-findet-man-in-meinem-blog&quot;&gt;Was findet man in meinem Blog?&lt;/h2&gt;

&lt;p&gt;Der Blog besteht aus meinen Experimenten mit Daten. Dahinter steht meist eine einfache Frage, die ich dann mit der oben beschriebenen Methode versuche zu lösen. Ich gebe also nicht nur eine Antwort auf die Frage, sondern versuche auch zu zeigen, wie man selber zu der Antwort kommt. Zum Zeitpunkt, als dieser Blog aus der Taufe gehoben wurde, gab es drei Einträge, anhand derer ich das kurz erläutern möchte:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;a href=&quot;/spiegel-cover/&quot;&gt;&lt;strong&gt;Wie hat sich das Cover vom Magazin Spiegel verändert?&lt;/strong&gt;&lt;/a&gt;
Vom Magazin “Der Spiegel” findet man die jeweiligen Covers seit der Erstausgabe 1947 &lt;a href=&quot;http://www.spiegel.de/spiegel/print/index-1947.html&quot;&gt;online&lt;/a&gt;. In dem Blogeintrag analysiere ich, wie sich das Cover über die Zeit enwickelt hat. Dazu werden die Covers nebeneinander und übereinander gelegt, und es wird auch eine Animation erzeigt.&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;a href=&quot;/kalender/&quot;&gt;&lt;strong&gt;Wie alt ist mein Sohn genau?&lt;/strong&gt;&lt;/a&gt;
Gut, diese konkrete Fragestellung würde jetzt einen eher kurzen Blogeintrag ergeben. Hier soll auch gezeigt werden, wie man sich ganz individuelle Kalendereinträge erstellen und in seinen eigenen Kalender importieren kann, die einen zum Beispiel erinnern, dass jemand heute 5.000 Tage alt wird.&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;a href=&quot;/karten-noe/&quot;&gt;&lt;strong&gt;Wo in Niederösterreich findet man als Mann am ehesten eine Frau?&lt;/strong&gt;&lt;/a&gt;
Hier war es jetzt nicht genau diese Fragestellung, die für mich spannend war – ich bin glücklich verheiratet. Ich wollte mit der Darstellung von Daten auf Landkarten experimentieren. Durch Zufall habe ich Daten gefunden, die diese Frage beantworten.&lt;/p&gt;
  &lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Ich hoffe, dass diese Sammlung im Laufe der Zeit wächst. Ein paar Ideen habe ich schon, jetzt braucht es nur noch die Zeit, diese umzusetzen. Ich freue mich natürlich auch über Anregungen.&lt;/p&gt;

&lt;h3 id=&quot;welche-programme-kommen-zum-einsatz&quot;&gt;Welche Programme kommen zum Einsatz?&lt;/h3&gt;

&lt;p&gt;Im Rahmen meines recht abstrakten Mathematikstudiums habe ich gerne ab und zu mit &lt;a href=&quot;https://de.wikipedia.org/wiki/Mathematica&quot;&gt;Mathematica&lt;/a&gt; oder &lt;a href=&quot;https://de.wikipedia.org/wiki/Matlab&quot;&gt;Matlab&lt;/a&gt; konkrete Berechnungen, Simulationen und ähnliches gemacht. Dort war es möglich, sich einem Problem Schritt für Schritt zu nähern, und so auch den oben erwähnten Lösungsweg zu dokumentieren. Mein Studium liegt allerdings schon eine Weile zurück.&lt;/p&gt;

&lt;p&gt;Vor einiger Zeit wollte ich einmal wieder etwas in diese Richtung machen. Nur beide Programme kosten für Nicht-Studenten einiges an Geld. So habe ich mich auf die Suche nach Alternativen gemacht. Gleichzeitig war mein Fokus weniger auf mathematisch komplexen Themen, sondern mehr in Richtung Datenanalyse, -aufbereitung und -präsentation. Daten gibt es im Internet ja mehr als genug. Und durch Simulationen, kann man auch noch welche erzeugen. Im Laufe meiner Suche bin ich auf IPython und Jupyter Notebooks gestoßen und war sofort begeistert. Was verbirgt sich dahinter:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;a href=&quot;https://de.wikipedia.org/wiki/Python_(Programmiersprache)&quot;&gt;Python&lt;/a&gt; Eine benutzer-/einsteigerfreundliche Programmiersprache, die auch ein Nicht-Programmier-Profi wie ich nutzen kann. Der Code ist sehr lesbar.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;http://ipython.org/&quot;&gt;IPython&lt;/a&gt; Das I steht für interaktiv, sprich man programmiert nicht ein fixes, statisches Programm, sondern man führt interaktiv Befehle aus, um Daten zu laden, zu bearbeiten und zu präsentieren. Man findet die Lösung also Schritt für Schritt.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;http://jupyter.org/&quot;&gt;Jupyter Notebooks&lt;/a&gt; Das Spielen mit den Daten erfolgt im Browser, wobei ein Dokument entsteht, in dem Code, Ergebnisse und Erklärungen verschmelzen. Der Lösungsweg wird also sozusagen automatisch dokumentiert und ist jederzeit nachvollziehbar.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;kontaktiere-mich&quot;&gt;Kontaktiere mich!&lt;/h3&gt;

&lt;p&gt;Ich freue mich über Feedback unter &lt;a href=&quot;mailto:christopher@datenspieler.com&quot;&gt;christopher@datenspieler.com&lt;/a&gt; sowie direkte Kommentare zu den einzelnen Einträgen.&lt;/p&gt;</content><author><name></name></author><summary type="html">Noch ein Blog mehr im Internet… Wozu? – Um mit Daten zu spielen! Wir alle schwimmen in einem Meer an Daten: Wörtern, Bildern, Zahlen, Wahrscheinlichkeiten und unnützem Wissen. Wir leben in einer Zeit, in der eine unglaubliche Menge an Daten jeden Augenblick erzeugt wird. Ich will zeigen, wie einfach es ist, diese Daten in spannende Informationen zu verwandeln. Ich jongliere mit ihnen, experimentiere und analysiere sie. Und ich möchte möglichst vielen Lust machen, es mir gleichzutun.</summary></entry><entry><title type="html">Wie hat sich das Cover vom Magazin Spiegel verändert?</title><link href="http://datenspieler.com/spiegel-cover/" rel="alternate" type="text/html" title="Wie hat sich das Cover vom Magazin Spiegel verändert?" /><published>2016-07-03T00:00:00+00:00</published><updated>2016-07-03T00:00:00+00:00</updated><id>http://datenspieler.com/spiegel-cover</id><content type="html" xml:base="http://datenspieler.com/spiegel-cover/">&lt;p&gt;Die Idee zu dieser Analyse stammt von einem &lt;a href=&quot;http://www.pyimagesearch.com/2015/10/19/analyzing-91-years-of-time-magazine-covers-for-visual-trends/&quot; target=&quot;_blank&quot;&gt;Artikel&lt;/a&gt;, in dem die Cover des Time Magazine analysiert werden. Um das wirklich zu verstehen und etwas dazuzulernen, wollte ich etwas Ähnliches für ein deutschsprachiges Magazine machen. Dafür hat sich der &lt;a href=&quot;https://www.spiegel.de&quot; target=&quot;_blank&quot;&gt;Spiegel&lt;/a&gt; angeboten, da es dort Covers aus mehr als 60 Jahren &lt;a href=&quot;http://www.spiegel.de/spiegel/print/index-1947.html&quot; target=&quot;_blank&quot;&gt;gibt&lt;/a&gt;. Das Copyright an den Coverbildern liegt somit natürlich beim Spiegel.&lt;/p&gt;

&lt;h2 id=&quot;das-ipython-notebook&quot;&gt;Das IPython Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2016-spiegel/Covers.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2016-spiegel/Covers.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2016-spiegel/Covers.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;wie-hat-sich-das-cover-vom-spiegel-entwickelt&quot;&gt;Wie hat sich das Cover vom Spiegel entwickelt?&lt;/h2&gt;

&lt;p&gt;Hier ein Überblick über die Entwicklung des Covers in Zehnjahres-Schritten.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/galerie.jpg&quot; alt=&quot;Galerie&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Nun wollen wir uns die Entwicklung etwas genauer anschauen. Die ersten drei Jahre, 1947, 1948 und 1949 hat sich das Cover vom Spiegel kaum verändert. Das Bild unten zeigt die Cover dieser drei Jahre übereinandergelegt und jeweils den durchschnittlichen Wert angezeigt.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1947_1948_1949.jpg&quot; alt=&quot;1947_1948_1949&quot; /&gt;&lt;/p&gt;

&lt;p&gt;In den Jahren 1950 bis 1954 ist der Text “DER SPIEGEL” nach links gewandert. Zusätzlich erkennt man ein “Durchschnittsgesicht”. Somit wird klar, dass in diesen Jahren wohl fast immer ein Kopf in ziemlich ähnlicher Perspektive abgebildet war.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1950_1951_1952_1953_1954.jpg&quot; alt=&quot;1950_1951_1952_1953_1954&quot; /&gt;&lt;/p&gt;

&lt;p&gt;In den darauffolgenden 5 Jahren ist der Titel einzeilig geworden.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1955_1956_1957_1558_1959.jpg&quot; alt=&quot;1955_1956_1957_1958_1959&quot; /&gt;&lt;/p&gt;

&lt;p&gt;In den Jahren 1960 bis 1964 hat sich die Schriftart leicht geändert und der weiße Balken am unteren Rand des Titelbildes ist verschwunden. Zusätzlich wird das “Durchschnittsgesicht” weniger deutlich - das bedeutet, es kommen auch Covers, die kein Gesicht zeigen.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1960_1961_1962_1963_1964.jpg&quot; alt=&quot;1960_1961_1962_1963_1964&quot; /&gt;&lt;/p&gt;

&lt;p&gt;In den nächsten 5 Jahren (1965 - 1969) verschwindet das “Durchschnittsgesicht” fast ganz.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1965_1966_1967_1968_1969.jpg&quot; alt=&quot;1965_1966_1967_1968_1969&quot; /&gt;&lt;/p&gt;

&lt;p&gt;In den darauffolgenden 70er Jahren ändert sich lediglich die Schriftart leicht.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1970_1971_1972_1973_1974_1975_1976_1977_1978_1979.jpg&quot; alt=&quot;1970_1971_1972_1973_1974_1975_1976_1977_1978_1979&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Und auch in den 80ern und 90ern gibt es keine merkbaren Änderungen.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-1980_1981_1982_1983_1984_1985_1986_1987_1988_1989_1990_1991_1992_1993_1994_1995_1996_1997_1998_1999.jpg&quot; alt=&quot;1980_1981_1982_1983_1984_1985_1986_1987_1988_1989_1990_1991_1992_1993_1994_1995_1996_1997_1998_1999&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Mit dem Millennium bekommt das Cover einen etwas anderen Farbton und die Position des Titels und des Rahmens scheint sich zu wandeln (in den Jahren 2000 bis 2016) der Jahre 2000 - 2016. Das kann natürlich auch einfach an den Bildern liegen, nicht am tatsächlichen Cover. Rechts oben sieht man nun recht deutlich einen Strichcode, der im vorigen Bild schon leicht wahrzunehmen war - genau genommen wurde der Strichcode rechts oben im Jahr 1993 eingeführt.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;img src=&quot;/images/2016-spiegel/avg-2000_2001_2002_2003_2004_2005_2006_2007_2008_2009_2010_2011_2012_2013_2014_2015_2016.jpg&quot; alt=&quot;2000_2001_2002_2003_2004_2005_2006_2007_2008_2009_2010_2011_2012_2013_2014_2015_2016&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;ein-großes-poster-mit-allen-covers&quot;&gt;Ein großes Poster mit allen Covers&lt;/h2&gt;

&lt;p&gt;Statt übereinander kann man die Covers natürlich auch einfach nebeneinander zusammenfügen. Im zugehörigen Notebook sind das nicht mal 20 Zeilen Code. Das Bild unten zeigt die Cover pro Jahr (Zeile) und Woche (Spalte). Das Bild ist recht groß, ein Klick auf das Bild unten, öffnet das Bild in einem extra Fenster, in dem man es dann leicht in voller Größe sehen kann.&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;a href=&quot;/images/2016-spiegel/strip.jpg&quot; target=&quot;_blank&quot;&gt;
&lt;img src=&quot;/images/2016-spiegel/strip.jpg&quot; alt=&quot;Poster&quot; /&gt;
&lt;/a&gt;&lt;/p&gt;

&lt;h2 id=&quot;bewegte-bilder&quot;&gt;Bewegte Bilder&lt;/h2&gt;

&lt;p&gt;Natürlich können die Bilder mit wenigen Befehlen, siehe zugehöriges Notebook, auch zu einer Animation zusammengefügt werden. Damit die Animation nicht zu lange dauert, habe ich pro Jahr nur das erste Bild genommen, das kann natürlich leicht angepasst werden. Zusätzlich wird das jeweilige Datum des Covers am unteren Rand angegeben. (In älteren Browsern wird die Animation nicht automatisch unten angezeigt - in dem Fall kann die Datei über den Link unten heruntergeladen und dann angeschaut werden.)&lt;/p&gt;

&lt;p class=&quot;center&quot;&gt;&lt;a href=&quot;/images/2016-spiegel/animated.gif&quot; target=&quot;_blank&quot;&gt;
&lt;img src=&quot;/images/2016-spiegel/animated.gif&quot; alt=&quot;Animation&quot; /&gt;
&lt;/a&gt;&lt;/p&gt;</content><author><name></name></author><summary type="html">Die Idee zu dieser Analyse stammt von einem Artikel, in dem die Cover des Time Magazine analysiert werden. Um das wirklich zu verstehen und etwas dazuzulernen, wollte ich etwas Ähnliches für ein deutschsprachiges Magazine machen. Dafür hat sich der Spiegel angeboten, da es dort Covers aus mehr als 60 Jahren gibt. Das Copyright an den Coverbildern liegt somit natürlich beim Spiegel.</summary></entry><entry><title type="html">Wie alt ist mein Sohn genau?</title><link href="http://datenspieler.com/kalender/" rel="alternate" type="text/html" title="Wie alt ist mein Sohn genau?" /><published>2016-07-02T00:00:00+00:00</published><updated>2016-07-02T00:00:00+00:00</updated><id>http://datenspieler.com/kalender</id><content type="html" xml:base="http://datenspieler.com/kalender/">&lt;p&gt;Beim zweiten Kind ist alles anders. Seit ein paar Wochen kann ich das aus persönlicher Erfahrung bestätigen. Falls jemand nicht weiß, was ich damit meine,   &lt;a href=&quot;http://www.huffingtonpost.de/sylvia-sima/zweites-kind-unterschied_b_9561886.html&quot;&gt;hier&lt;/a&gt; ein Artikel, der das recht gut zusammenfasst. Ein persönliches Erlebnis war der Besuch einer Babygruppe, in dem meine Frau von einer Einfach-Mama gefragt wurde, wie alt ihr Baby denn ist. Ihre Antwort – gut zwei Monate – löste Entsetzen aus. Die richtige Antwort hätte nämlich gelautet, 9 Wochen, 2 Tage und 3 Stunden.&lt;/p&gt;

&lt;p&gt;Als mir meine Frau von ihrem Erlebnis erzählt, war klar, hier muss Hilfe her. Zum Glück ist es nicht sonderlich kompliziert mit Python Kalender-Files, mit beliebigen Ereignissen dazugehörige, errechnete Zeitpunkte zu erstellen. Dieses Kalender-File kann man dann z. B. in Google Calendar importieren, sodass man auf einen Blick immer weiß, wie alt sein Kind genau ist.&lt;/p&gt;

&lt;p&gt;Konkret habe ich mich für folgende Einträge entschieden:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;fürs erste halbe Jahr jeweils einen Eintrag pro Wochen (&lt;em&gt;Baby X ist y Wochen alt&lt;/em&gt;)&lt;/li&gt;
  &lt;li&gt;für die ersten zwei Jahre jeweils einen Eintrag pro Monat (&lt;em&gt;Baby X ist y Monate alt&lt;/em&gt;)&lt;/li&gt;
  &lt;li&gt;99 Jahre lang den Geburtstag&lt;/li&gt;
  &lt;li&gt;besondere Anzahl an Tagen, z.b. &lt;em&gt;Kind X ist 1000 Tage alt&lt;/em&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Das kann natürlich leicht an persönliche Vorlieben angepasst werden.&lt;/p&gt;

&lt;h2 id=&quot;das-ipython-notebook&quot;&gt;Das IPython Notebook&lt;/h2&gt;

&lt;p&gt;Wie gewohnt gibt es das entsprechende IPython Notebook in 3 Varianten:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://nbviewer.jupyter.org/github/datenspieler/notebooks_for_blog/blob/master/2016-kalender/Kalender.ipynb&quot; target=&quot;_blank&quot;&gt;nbviewer&lt;/a&gt; eine statische Variante&lt;/li&gt;
  &lt;li&gt;Via &lt;a href=&quot;http://mybinder.org/repo/Datenspieler/notebooks_for_blog/2016-kalender/Kalender.ipynb&quot; target=&quot;_blank&quot;&gt;mybinder&lt;/a&gt; online selbst herumspielen. Kleine Warnung, mybinder ist ein tolles, gratis Service, um online Notebooks auzuführen, es ist aber auch recht langsam. Insbesondere der erste Aufruf der Seite dauert recht lange, da hier erst mal ein viruteller Server gestartet werden muss.&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://gitcdn.link/repo/Datenspieler/notebooks_for_blog/master/2016-kalender/Kalender.ipynb&quot; target=&quot;_blank&quot;&gt;Herunterladen&lt;/a&gt; des entsprechenden IPython Notebooks, zum Selberherumspielen, vorausgesetzt man hat IPython und Co. installiert. Falls weitere Files benötigt werden, sind diese via &lt;a href=&quot;https://github.com/Datenspieler/notebooks_for_blog&quot; target=&quot;_blank&quot;&gt;Github&lt;/a&gt; verfügbar.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Bei der Variante via mybinder, kann man leicht die entsprechenden Daten anpassen (Namen und Geburststage der Kinder), das Notebook dann ausführen (z. B. via Menüpunkt &lt;code class=&quot;highlighter-rouge&quot;&gt;Cell&lt;/code&gt;, &lt;code class=&quot;highlighter-rouge&quot;&gt;Run All&lt;/code&gt; oder mit &lt;code class=&quot;highlighter-rouge&quot;&gt;Shift-Enter&lt;/code&gt; jede Zeile schrittweise ausführen) und das erzeugte Kalender-File herunterladen.&lt;/p&gt;

&lt;h2 id=&quot;import-in-kalender-programm&quot;&gt;Import in Kalender-Programm&lt;/h2&gt;

&lt;p&gt;Ich verwende &lt;a href=&quot;https://calendar.google.com&quot;&gt;Google Calendar&lt;/a&gt; und werde dafür den Prozess beschreiben. Für andere Programme gibt es sicher entsprechende Möglichkeiten.&lt;/p&gt;

&lt;p&gt;Ich empfehle zuerst einen eigenen Kalender zu erzeugen. Falls man die Einträge z. B. mal löschen will, kann man das in einem Schritt machen, und muss nicht alle einzeln entfernen. Dazu auf &lt;a href=&quot;https://calendar.google.com&quot;&gt;Google Calendar&lt;/a&gt; unter Settings&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2016-kalender/01.png&quot; alt=&quot;Schritt 1&quot; /&gt;&lt;/p&gt;

&lt;p&gt;auf den Tab mit den Kalendern wechseln,&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2016-kalender/02.png&quot; alt=&quot;Schritt 2&quot; /&gt;&lt;/p&gt;

&lt;p&gt;dann das Fenster zum Anlegen eines neuen Kalenders öffnen&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2016-kalender/03.png&quot; alt=&quot;Schritt 3&quot; /&gt;&lt;/p&gt;

&lt;p&gt;und den entsprechend benannten Kalender anlegen.&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2016-kalender/04.png&quot; alt=&quot;Schritt 4&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Dann muss das erzeugte Kalender-File importiert werden. Dazu die ersten beiden Schritte oben ausführen, diesmal aber keinen neuen Kalender anlegen, sondern daneben klicken um das Fenster zum Importieren zu öffnen.
&lt;img src=&quot;/images/2016-kalender/05.png&quot; alt=&quot;Schritt 5&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Dann das erzeugte Kalender-File hochladen, und den oben erzeugten Kalender auswählen, in den die Ereignisse importiert werden sollen.
&lt;img src=&quot;/images/2016-kalender/06.png&quot; alt=&quot;Schritt 6&quot; /&gt;&lt;/p&gt;

&lt;p&gt;Und dann kann meine Frau in der nächsten Babygruppe auftrumpfen, wenn sie z. B. erklären kann, dass ihr Kind nun genau 5000 Tage alt ist. Obwohl dann ist es wahrscheinlich kaum mehr eine Babygruppe ;-)&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/images/2016-kalender/07.png&quot; alt=&quot;Schritt 7&quot; /&gt;&lt;/p&gt;</content><author><name></name></author><summary type="html">Beim zweiten Kind ist alles anders. Seit ein paar Wochen kann ich das aus persönlicher Erfahrung bestätigen. Falls jemand nicht weiß, was ich damit meine, hier ein Artikel, der das recht gut zusammenfasst. Ein persönliches Erlebnis war der Besuch einer Babygruppe, in dem meine Frau von einer Einfach-Mama gefragt wurde, wie alt ihr Baby denn ist. Ihre Antwort – gut zwei Monate – löste Entsetzen aus. Die richtige Antwort hätte nämlich gelautet, 9 Wochen, 2 Tage und 3 Stunden.</summary></entry></feed>