Das Zensus 2011 Gesetz ist sehr schwammig und mitunter habe ich einige Dinge übersehen. Dennoch habe ich mal die Pause genutzt und Tabellen erstellt mit den resultierenden und verbleibenden Datensätzen, die nach spätestens 4 Jahren anonymisiert werden. Ich habe bewusst die angeblichen Hilfsmerkmale weggelassen, um aufzuzeigen, was übrig bleiben soll. Angeblich nach Aussage unserer Regierung bliebe nichts Rückführbares übrig. Nun gut …
Nach dem Zensus 2011 Gesetz (ZensG) werden in §3, §4, §5, §6 und §7 Daten erhoben. Zum Einen Erhebungsmerkmale und zum anderen Hilfsmerkmale. Laut §19 heißt es:
(1) Die Hilfsmerkmale sind von den Erhebungsmerkmalen zum frühestmöglichen Zeitpunkt zu trennen und gesondert aufzubewahren. Sie sind, soweit sich nicht aus § 22 Absatz 2 und § 23 etwas anderes ergibt, zu löschen, sobald bei den statistischen Ämtern die Überprüfung der Erhe- bungs- und Hilfsmerkmale auf ihre Schlüssigkeit und Vollständigkeit abgeschlossen ist. Sie sind spätestens vier Jahre nach dem Berichtszeitpunkt zu löschen.
(2) Die Erhebungsunterlagen sind nach Abschluss der Aufbereitung des Zensus, spätestens vier Jahre nach dem Berichtszeitpunkt zu vernichten.
Das heißt für mich als Laien, dass spätestens nach 4 Jahren (!!!) sämtliche Hilfsmerkmale aus den Datensätzen entfernt sein müssen. Ein Hilfsmerkmal ist zum Beispiel der Name eines Bürgers. Ein Hilfsmerkmal ist auch das Geburtsdatum, ABER nur der Tag. Monat und Jahr bleiben bestehen.
Die letzten Tage hatte ich etwas gestutzt – vielleicht ist da auch nichts dran, aber im Hinblick auf die Tolle Werbung des Zensus 2011 habe ich mir Gedanken gemacht, wie die erhobenen Daten letztendlich für die Ziele des Staates überhaupt genutzt werden könnten. So bewirbt man die Wichtigkeit des Zensus mit folgenden Thesen:
- Wie entstehen Wohnungen da, wo wir sie brauchen?
- Welche Infrastruktur bringt uns weiter?
- Wie viele Studienplätze brauchen wir?
- Wie lenken wir unseren Verkehr?
Allein bei der ersten Frage kamen bei mir Fragen auf. Damit der Staat weiß, wo Wohnungen benötigt werden, muss er natürlich in den resultierenden Datensätzen wissen, wo es überhaupt Wohnungen gibt. Hierzu reicht es meiner Meinung nach nicht zwingend aus in welcher Gemeinde, sondern am Besten noch Stadtteil – oder gar noch detaillierter. Ich habe mir also die dazugehörige gesetzliche Regelung angesehen. Dies ist in §6 geregelt. Unter §6 (3) steht zudem:
(3) Hilfsmerkmale sind:
[...]
5. Straße, Hausnummer und Anschriftenzusätze der Wohnung.
Schön und gut – aber was ist mit dem Gebäude in der die Wohnung sich befindet? Als Hilfsmerkmal ist dort nichts weiter aufgeführt, weswegen ich davon ausgehen muss/kann, dass das Gebäude sehr wohl noch den Adressdatenbestand besitzt.
Wieso ist dieser Aspekt wichtig? Wenn man nun die laienhafte Auflistung (Tabelle) sich betrachtet, müssen ja statistische Daten resultierend sein. Hierzu werden zuerst die erhobenen Datenbestände miteinander verknüpft und dann aus den jeweiligen Datenbeständen irgendwann die Hilfsmerkmale entfernt.
Mit dem wenigen Datenbank-KnowHow – da gibt es weit aus bessere Spezies – heißt das für mich, dass jeder erhobene Datensatz in einger jeweils eigenen Tabelle sich befindet. Es gibt eine Tabelle für Gebäude, in der die Daten der Gebäude erfasst werden, eine für Wohnungen, eine für die Daten des Bundesamtes für Arbeit usw. Jedem Datensatz wird eine eineindeutige ID verpasst. Jedem Gebäude, jeder Wohnung, jedem Bürger … danach werden mit Hilfe der Hilfsmerkmale die Daten verknüpft. Logischerweise über Verknüpfen in einer separaten Tabelle mit Hilfe der IDs über Referenzschlüssel. Etwas anderes macht meiner Meinung nach keinen Sinn.
Dies hat zur Folge, dass dann Adressdaten der Wohnungen gelöscht werden, dennoch eine Beziehung zu einem Gebäude mit Adressdaten existieren. Etwas anderes würde auch keinen Sinn machen, weil man sonst nicht sonderlich feststellen kann “Wo Wohnungen entstehen sollen“. Übrigens werden laut Datensatzbeschreibung keine Adressdaten für Wohnungen erfasst, sondern nur für Gebäude, weshalb davon auszugehen ist, dass besagter 5. Punkt eh obsolet ist.
Ein oder mehrere Bürger sind mittels ihrer Personen-ID einer Wohnung zugeordnet, somit einem Gebäude und ergo somit einer Adresse. Zudem gesellt sich die Information des Arbeitgebers (wenn vorhanden) zwar nicht mit der Adresse, aber in welcher Gemeinde und des Firmennamens, welche nicht gelöscht werden.
Und kann mir jetzt einer sagen, dass die Daten nach der “Anonymisierung” – sprich Entfernung der Hilfsmerkmale – nicht reproduzierbar sind? Je nach Faktenlage, z.B. Firmenname und Wohnort, kann ich auf mindestens eine Person in einem jeweiligen Gebäude schließen. Zusammen mit dem Geburtsdatum (Monat + Jahr) ist es noch weiter möglich, dies auf eine spezifische Person einzugrenzen.
Ich selbst bin noch nicht komplett durch, aber fürs Erste reicht es mir, dass ich fast allein mit 3 Merkmalen auf eine Person schließen kann, nebst Adresse des Wohngebäudes und sämtlichen gespeicherten Daten. Vielleicht habe ich mich ja gedanklich vertan, weswegen ich mich freue, wenn das Ganze entkräftet werden kann.
Das verstehe ich jedenfalls nicht unter “Nicht-Rückschließbar”!