Getagged : Analyse

Zensus 2011: Ein Überblick über die gesammelten und verknüpften Daten

 

Das Zensus 2011 Gesetz ist sehr schwammig und mitunter habe ich einige Dinge übersehen. Dennoch habe ich mal die Pause genutzt und Tabellen erstellt mit den resultierenden und verbleibenden Datensätzen, die nach spätestens 4 Jahren anonymisiert werden. Ich habe bewusst die angeblichen Hilfsmerkmale weggelassen, um aufzuzeigen, was übrig bleiben soll. Angeblich nach Aussage unserer Regierung bliebe nichts Rückführbares übrig. Nun gut …

Nach dem Zensus 2011 Gesetz (ZensG) werden in §3, §4, §5, §6 und §7 Daten erhoben. Zum Einen Erhebungsmerkmale und zum anderen Hilfsmerkmale. Laut §19 heißt es:

(1) Die Hilfsmerkmale sind von den Erhebungsmerkmalen zum frühestmöglichen Zeitpunkt zu trennen und gesondert aufzubewahren. Sie sind, soweit sich nicht aus § 22 Absatz 2 und § 23 etwas anderes ergibt, zu löschen, sobald bei den statistischen Ämtern die Überprüfung der Erhe- bungs- und Hilfsmerkmale auf ihre Schlüssigkeit und Vollständigkeit abgeschlossen ist. Sie sind spätestens vier Jahre nach dem Berichtszeitpunkt zu löschen.

(2) Die Erhebungsunterlagen sind nach Abschluss der Aufbereitung des Zensus, spätestens vier Jahre nach dem Berichtszeitpunkt zu vernichten.

Das heißt für mich als Laien, dass spätestens nach 4 Jahren (!!!) sämtliche Hilfsmerkmale aus den Datensätzen entfernt sein müssen. Ein Hilfsmerkmal ist zum Beispiel der Name eines Bürgers. Ein Hilfsmerkmal ist auch das Geburtsdatum, ABER nur der Tag. Monat und Jahr bleiben bestehen.

Die letzten Tage hatte ich etwas gestutzt – vielleicht ist da auch nichts dran, aber im Hinblick auf die Tolle Werbung des Zensus 2011 habe ich mir Gedanken gemacht, wie die erhobenen Daten letztendlich für die Ziele des Staates überhaupt genutzt werden könnten. So bewirbt man die Wichtigkeit des Zensus mit folgenden Thesen:

  • Wie entstehen Wohnungen da, wo wir sie brauchen?
  • Welche Infrastruktur bringt uns weiter?
  • Wie viele Studienplätze brauchen wir?
  • Wie lenken wir unseren Verkehr?

Allein bei der ersten Frage kamen bei mir Fragen auf. Damit der Staat weiß, wo Wohnungen benötigt werden, muss er natürlich in den resultierenden Datensätzen wissen, wo es überhaupt Wohnungen gibt. Hierzu reicht es meiner Meinung nach nicht zwingend aus in welcher Gemeinde, sondern am Besten noch Stadtteil – oder gar noch detaillierter. Ich habe mir also die dazugehörige gesetzliche Regelung angesehen. Dies ist in §6 geregelt. Unter §6 (3) steht zudem:

(3) Hilfsmerkmale sind:

[...]

5. Straße, Hausnummer und Anschriftenzusätze der Wohnung.

Schön und gut – aber was ist mit dem Gebäude in der die Wohnung sich befindet? Als Hilfsmerkmal ist dort nichts weiter aufgeführt, weswegen ich davon ausgehen muss/kann, dass das Gebäude sehr wohl noch den Adressdatenbestand besitzt.

Wieso ist dieser Aspekt wichtig? Wenn man nun die laienhafte Auflistung (Tabelle) sich betrachtet, müssen ja statistische Daten resultierend sein. Hierzu werden zuerst die erhobenen Datenbestände miteinander verknüpft und dann aus den jeweiligen Datenbeständen irgendwann die Hilfsmerkmale entfernt.

Mit dem wenigen Datenbank-KnowHow – da gibt es weit aus bessere Spezies – heißt das für mich, dass jeder erhobene Datensatz in einger jeweils eigenen Tabelle sich befindet. Es gibt eine Tabelle für Gebäude, in der die Daten der Gebäude erfasst werden, eine für Wohnungen, eine für die Daten des Bundesamtes für Arbeit usw. Jedem Datensatz wird eine eineindeutige ID verpasst. Jedem Gebäude, jeder Wohnung, jedem Bürger … danach werden mit Hilfe der Hilfsmerkmale die Daten verknüpft. Logischerweise über Verknüpfen in einer separaten Tabelle mit Hilfe der IDs über Referenzschlüssel. Etwas anderes macht meiner Meinung nach keinen Sinn.

Dies hat zur Folge, dass dann Adressdaten der Wohnungen gelöscht werden, dennoch eine Beziehung zu einem Gebäude mit Adressdaten existieren. Etwas anderes würde auch keinen Sinn machen, weil man sonst nicht sonderlich feststellen kann “Wo Wohnungen entstehen sollen“. Übrigens werden laut Datensatzbeschreibung keine Adressdaten für Wohnungen erfasst, sondern nur für Gebäude, weshalb davon auszugehen ist, dass besagter 5. Punkt eh obsolet ist.

Ein oder mehrere Bürger sind mittels ihrer Personen-ID einer Wohnung zugeordnet, somit einem Gebäude und ergo somit einer Adresse. Zudem gesellt sich die Information des Arbeitgebers (wenn vorhanden) zwar nicht mit der Adresse, aber in welcher Gemeinde und des Firmennamens, welche nicht gelöscht werden.

Und kann mir jetzt einer sagen, dass die Daten nach der “Anonymisierung” – sprich Entfernung der Hilfsmerkmale – nicht reproduzierbar sind? Je nach Faktenlage, z.B. Firmenname und Wohnort, kann ich auf mindestens eine Person in einem jeweiligen Gebäude schließen. Zusammen mit dem Geburtsdatum (Monat + Jahr) ist es noch weiter möglich, dies auf eine spezifische Person einzugrenzen.

Ich selbst bin noch nicht komplett durch, aber fürs Erste reicht es mir, dass ich fast allein mit 3 Merkmalen auf eine Person schließen kann, nebst Adresse des Wohngebäudes und sämtlichen gespeicherten Daten. Vielleicht habe ich mich ja gedanklich vertan, weswegen ich mich freue, wenn das Ganze entkräftet werden kann.

Das verstehe ich jedenfalls nicht unter “Nicht-Rückschließbar”!

 

De-Menz

War klar, dass das Bürgerportal-Gesetz so schnell intern im Kabinett beschlossen wurde. Und bisher haben sich meine Unkenrufe alle Male bestätigt. Hier ist also die neue De-Menz (Deutsche Email Mit Eingebautem Nachrichtendienst Zugang), ähh ..De-Mail!

Kommen wir also zu den Fakten.

  1. De-Mail kostet Porto, denn nach “Berechnungen des Bundesinnenministeriums soll De-Mail jährlich zwischen 1 Milliarden und 1,5 Milliarden Euro einsparen, die sonst für den Versand ausgegeben werden“. Und damit die Einsparungen gegenfinanziert werden können: “Für den Versand und die Bestätigigung muss er Porto bezahlen.
    Geile Logik, muss ich schon sagen! Was machen die mit den von unseren Steuergeldern eingesparten Milliarden, plus den neuen Portogebühren?
  2. De-Mail kostet mindestens Einrichtungsgebühren, wenn nicht sogar Grundgebühren: “Jeder Bürger, der sich eine kostenpflichtige De-Mail-Adresse zulegt, kann vertrauliche und verschlüsselte Mails verschicken und empfangen.
  3. De-Mail verschlüsselt erst ab dem Provider. Ergo, die vertraulichen und zu verschlüsselnden Daten wandern ungeschützt vom Router zum Mail-Provider. Ist klar, denn sonst könnte man gar nicht bei Straftaten die Daten auswerten. Somit kann immer noch sich eingeklinkt werden. Sei es der Staat oder schadhaftes Gewürm auf den Rechnern von Infizierten – den Schutzlosen! Die Mail muss immerhin vom Rechner bis zum Mailserver des Providers – das ist ein langer Weg. Der Satz sagt eigentlich schon alles: “De-Mail unterliegt den gesetzlichen Rahmenbedingungen der elektronischen Kommunikation. Das heißt, das Mitlesen von Inhalten ist grundsätzlich nur nach entsprechender richterlicher Anordnung möglich, wie es auch bei Papierpost der Fall ist. Ansonsten wird die gesamte Kommunikation und Datenablage standardmäßig vom Provider verschlüsselt.” Also ist Mitlesen möglich und erwünscht. Ich glaube kaum, dass stinknormale Postkarten nachvollziehbar sind .. das nenne ich einmal eine vertrauensvolle Leistungsbeschreibung eines kostenpflichtigen Verschlüsselungsdienstes. Ich kann mir gar nicht ausmalen, wer so blöd sein sollte
  4. Die privaten Schlüssel zur Signierung und Verschlüsselung liegen nicht in der Hand des Nutzers, sondern in der Hand des Providers und des Staates bzw. der ausführenden und organisierenden Behörde. Insofern kann von gesicherter Vertraulichkeit und Integrität keine Rede sein. Ich bin mal gespannt, wie schnell auf einmal eine dieser verschlüsselten Mails oder Daten von ganz alleine sich entschlüsselt, nur weil ein richterlicher Beschluss in der Luft herumgewedelt wird. Und vor allem: welcher Art richterlicher Beschluss, sprich welcher Straftat, erlaubt es das?
  5. Wer seine De-Mails auf Grund von Internetproviderwechsel, Mailproviderwechsel, Sperrung, Abwesenheit usw. nicht abholt, der verpasst somit auch die verbindlichen Zustellfristen von Rechtsbescheiden, Dokumenten, Behördenbescheiden, Mahnbescheiden, Bußgeldbescheiden, Falschparktickets usw. Bei der Post kann ich jemanden dazu beauftragen, dass jemand in Abwesenheit meiner Person meine Post liest und mich informiert. Wer wird also diese “vertrauliche” Mailadresse anderen zur Einsicht bzw. zur Verfügung stellen, mit der verbindliche Einkäufe, Nachweise und anderes Gedöns angestellt werden können? Na?
  6. Gemäß §25 der Verordnung erhält das BMI in meinen Augen Ermächtigungen, bestimmte Paragraphen umgestalten zu dürfen – unabhängig vom Bundesrat. Ein Schelm, der daran denkt, dass die freiwillige De-Mail auf einmal zur Pflicht werden lässt. Weitere Hintertürchen sind in dem Text nicht nur unscheinbar auffindbar. Wer lesen kann, der ist im Vorteil!
  7. Hat sich schon einmal jemand über die Langzeitarchivierung Gedanken gemacht? jetzt hab ich ein amtliches Papier in einem Ordner im Schrank. Dann habe ich ein Dokument auf der Festplatte. Nur das Dokument ist signiert, der Ausdruck aber nicht. Was passiert beim Datenverlust?

Hab ich noch etwas vergessen? Mit Sicherheit! Aber allein diese Punkte schüren bei mir den inneren Drang ganz weit Abstand vor der De-MenzMail zu nehmen. Da “vertraue” ich ja lieber Google, als den Mist hier.

Mich würde mal wirklich interessieren, wie die Befürworter aus behördlicher Sicht von “damals” jetzt darüber denken. Ist das immer noch eine tolle Sache und verhilft zu weniger Bürokratie? Wenn ja: ist es das wirklich wert? Würdet ihr dafür bezahlen wollen? Wird es Bürokratie einsparen? Wird es Ressourcen einsparen? Wird es auch für Jahrzehnte funktionieren – sprich die Dokumente weiterhin existieren, wie bei Papier inkl. Datensicherheit und Sicherung?

Apropos: Interessant wird es, wenn Trojaner die gültigen De-Mailadressen an Spamschleuder-Server und Botnetze schicken. Die kommen mit Sicherheit an und ich glaube kaum, dass dort Filtermechanismen seitens der Provider arbeiten dürften, denn sonst könnte ja ein wichtiger Bescheid versehentlich als Spam eingestuft werden. Sprich, je mehr ich drüber nachdenke, umso mehr Kritikpunkte an diesem System finde ich – obwohl, zugegebenerweise habe ich bisher kein gutes Haar dran gelassen, weil es kein gutes Haar gibt!