Getagged : Daten

Zensus 2011: Ein Überblick über die gesammelten und verknüpften Daten

 

Das Zensus 2011 Gesetz ist sehr schwammig und mitunter habe ich einige Dinge übersehen. Dennoch habe ich mal die Pause genutzt und Tabellen erstellt mit den resultierenden und verbleibenden Datensätzen, die nach spätestens 4 Jahren anonymisiert werden. Ich habe bewusst die angeblichen Hilfsmerkmale weggelassen, um aufzuzeigen, was übrig bleiben soll. Angeblich nach Aussage unserer Regierung bliebe nichts Rückführbares übrig. Nun gut …

Nach dem Zensus 2011 Gesetz (ZensG) werden in §3, §4, §5, §6 und §7 Daten erhoben. Zum Einen Erhebungsmerkmale und zum anderen Hilfsmerkmale. Laut §19 heißt es:

(1) Die Hilfsmerkmale sind von den Erhebungsmerkmalen zum frühestmöglichen Zeitpunkt zu trennen und gesondert aufzubewahren. Sie sind, soweit sich nicht aus § 22 Absatz 2 und § 23 etwas anderes ergibt, zu löschen, sobald bei den statistischen Ämtern die Überprüfung der Erhe- bungs- und Hilfsmerkmale auf ihre Schlüssigkeit und Vollständigkeit abgeschlossen ist. Sie sind spätestens vier Jahre nach dem Berichtszeitpunkt zu löschen.

(2) Die Erhebungsunterlagen sind nach Abschluss der Aufbereitung des Zensus, spätestens vier Jahre nach dem Berichtszeitpunkt zu vernichten.

Das heißt für mich als Laien, dass spätestens nach 4 Jahren (!!!) sämtliche Hilfsmerkmale aus den Datensätzen entfernt sein müssen. Ein Hilfsmerkmal ist zum Beispiel der Name eines Bürgers. Ein Hilfsmerkmal ist auch das Geburtsdatum, ABER nur der Tag. Monat und Jahr bleiben bestehen.

Die letzten Tage hatte ich etwas gestutzt – vielleicht ist da auch nichts dran, aber im Hinblick auf die Tolle Werbung des Zensus 2011 habe ich mir Gedanken gemacht, wie die erhobenen Daten letztendlich für die Ziele des Staates überhaupt genutzt werden könnten. So bewirbt man die Wichtigkeit des Zensus mit folgenden Thesen:

  • Wie entstehen Wohnungen da, wo wir sie brauchen?
  • Welche Infrastruktur bringt uns weiter?
  • Wie viele Studienplätze brauchen wir?
  • Wie lenken wir unseren Verkehr?

Allein bei der ersten Frage kamen bei mir Fragen auf. Damit der Staat weiß, wo Wohnungen benötigt werden, muss er natürlich in den resultierenden Datensätzen wissen, wo es überhaupt Wohnungen gibt. Hierzu reicht es meiner Meinung nach nicht zwingend aus in welcher Gemeinde, sondern am Besten noch Stadtteil – oder gar noch detaillierter. Ich habe mir also die dazugehörige gesetzliche Regelung angesehen. Dies ist in §6 geregelt. Unter §6 (3) steht zudem:

(3) Hilfsmerkmale sind:

[...]

5. Straße, Hausnummer und Anschriftenzusätze der Wohnung.

Schön und gut – aber was ist mit dem Gebäude in der die Wohnung sich befindet? Als Hilfsmerkmal ist dort nichts weiter aufgeführt, weswegen ich davon ausgehen muss/kann, dass das Gebäude sehr wohl noch den Adressdatenbestand besitzt.

Wieso ist dieser Aspekt wichtig? Wenn man nun die laienhafte Auflistung (Tabelle) sich betrachtet, müssen ja statistische Daten resultierend sein. Hierzu werden zuerst die erhobenen Datenbestände miteinander verknüpft und dann aus den jeweiligen Datenbeständen irgendwann die Hilfsmerkmale entfernt.

Mit dem wenigen Datenbank-KnowHow – da gibt es weit aus bessere Spezies – heißt das für mich, dass jeder erhobene Datensatz in einger jeweils eigenen Tabelle sich befindet. Es gibt eine Tabelle für Gebäude, in der die Daten der Gebäude erfasst werden, eine für Wohnungen, eine für die Daten des Bundesamtes für Arbeit usw. Jedem Datensatz wird eine eineindeutige ID verpasst. Jedem Gebäude, jeder Wohnung, jedem Bürger … danach werden mit Hilfe der Hilfsmerkmale die Daten verknüpft. Logischerweise über Verknüpfen in einer separaten Tabelle mit Hilfe der IDs über Referenzschlüssel. Etwas anderes macht meiner Meinung nach keinen Sinn.

Dies hat zur Folge, dass dann Adressdaten der Wohnungen gelöscht werden, dennoch eine Beziehung zu einem Gebäude mit Adressdaten existieren. Etwas anderes würde auch keinen Sinn machen, weil man sonst nicht sonderlich feststellen kann “Wo Wohnungen entstehen sollen“. Übrigens werden laut Datensatzbeschreibung keine Adressdaten für Wohnungen erfasst, sondern nur für Gebäude, weshalb davon auszugehen ist, dass besagter 5. Punkt eh obsolet ist.

Ein oder mehrere Bürger sind mittels ihrer Personen-ID einer Wohnung zugeordnet, somit einem Gebäude und ergo somit einer Adresse. Zudem gesellt sich die Information des Arbeitgebers (wenn vorhanden) zwar nicht mit der Adresse, aber in welcher Gemeinde und des Firmennamens, welche nicht gelöscht werden.

Und kann mir jetzt einer sagen, dass die Daten nach der “Anonymisierung” – sprich Entfernung der Hilfsmerkmale – nicht reproduzierbar sind? Je nach Faktenlage, z.B. Firmenname und Wohnort, kann ich auf mindestens eine Person in einem jeweiligen Gebäude schließen. Zusammen mit dem Geburtsdatum (Monat + Jahr) ist es noch weiter möglich, dies auf eine spezifische Person einzugrenzen.

Ich selbst bin noch nicht komplett durch, aber fürs Erste reicht es mir, dass ich fast allein mit 3 Merkmalen auf eine Person schließen kann, nebst Adresse des Wohngebäudes und sämtlichen gespeicherten Daten. Vielleicht habe ich mich ja gedanklich vertan, weswegen ich mich freue, wenn das Ganze entkräftet werden kann.

Das verstehe ich jedenfalls nicht unter “Nicht-Rückschließbar”!

 

Probleme von Datenbergen

Dass angesammelte Datenberge Probleme bzw. Unannehmlichkeiten für mitunter Betroffene bereiten kann, dass brauch ich (denke ich zumindest) nicht weiter erwähnen. Dass ein alleiniger Verlass auf die Bereitstellung dieser Daten falsch ist, zeigt ein Beispiel hierzu, welches sich heute bei mir auf während meiner Arbeit aufzeigte.

fehler-google-daten Ein Kunde rief mich heute zur Klärung einer Verständnisfrage an: Thema Google. Unser Kunde (A) wurde von einer anderen Firma (B) mit, nun sagen wir mal, sehr harschen Worten begrüßt und aufgefordert, etwas gegen Anrufe zu unternehmen, die ständig bei (B) eingehen. Die Anrufer wollten aber nicht (B) sprechen, sondern (A) – sprich, sie wählten die falsche Telefonnummer. Das Interessante dabei ist, woher die Anrufer die Telefonnummer her hatten – nämlich durch eine Suche in Google.

Es wurde nach dem Kunden (A) mittels Firmenname gesucht, man erhielt eine Darstellung wie im Screenshot hier rechts angezeigt (Grafik beinhaltet nicht den Kunden ;-) ). Fast alle Daten stimmten – bis auf die Telefonnummer. Die angezeigte Telefonnummer war die von (B).

Nun ist dies kein Fauxpas im eigentlichen Sinne, dennoch ist es für die Betroffenen mehr als ärgerlich, wenn Daten aus unerfindlichen Datenbergen falsch miteinander verknüpft werden und andere sich auf diese Informationen verlassen. (B) ist mehr als genervt und ist sauer auf (A) und fordert von (A) die Korrekturen bei Google. Von außen betrachtet eine David / Goliath Aufgabe.

Ich habe für (A) die Meldung bei Google vorgenommen und bin gespannt, wann dies dort geändert bzw. eingepflegt wird. Warum sich die Leute auf die dargelegten “Fakten” der Google-Suche alleinig verlassen, ist mir persönlich schleierhaft, wenn man bedenkt, dass der Gesuchte lediglich ein Ergebnis tiefer die offizielle Webpräsenz der betreffenden Firma (A) aufgelistet bekommt – und natürlich dort die richtige Telefonnummer erhalten kann.

Letztendlich stellen sich mehrere Fragen im Geiste auf:

  • Wenn Datensammlung was ganz Tolles sein soll – wie kann sicher gestellt werden, dass diese “korrekt” und fehlerfrei miteinander verknüpft sind?
  • Kann man überhaupt Fehler in der Kopplung der Daten ausschließen?
  • Ist es im Allgemeinen ein Kompetenzproblem (Medienkompetenz) der Anwender?
  • Wenn ja – wie kann man diesem begegnen?

Tja, und wie wirken sich solche kleinen Fehler in staatlichen Datenbanken aus? Allein wenn bereits Einem so etwas passiert, sollte man die Sinnfrage an die Bearbeiter im Innen- wie auch im Außendienst stellen.

Passt auf eure Daten auf

Ein Erlebnis vom Freitag, welches ich allen mal nahe legen möchte, hat mir doch etwas die Verwunderung in die Augen getrieben. Wir haben über die Bucht eine Stoffhandtasche (nein, nicht für mich – versteht sich von selbst) ersteigert, welche auch uns prompt zugesendet wurde. Beim Auspacken der Tasche aus der Verpackung fielen uns eine Menge Zettel entgegen.

Nun waren das keine gewöhnlichen Zettel. Nein, es waren diverse Krankenscheine, Krankschreibungen diverser Art, Überweisungen, Schriftwechsel mit der Krankenkasse und eine Rechnung über eine Pink-Vamp-Perücke aus dem Sex-Shop! Wir wüssten nun ohne Anstrengungen die Adressdaten (das wüssten wir auch ohne das Ganze), Geburtsdatum, Krankenversichertennummer, Krankheitsverlauf der letzten Wochen, Medikamentation, behandelnde Ärzte, Kontoverbindungsdaten (auf Grund der via EC bezahlten Rechnungen) usw.

Nach Rücksprache mit dem Verkäufer haben wir das Ganze wieder zurückgesendet, welcher heilfroh war, das Ganze wieder zurück zu erhalten. Angenommen, ich wäre bei einer Versicherungsagentur tätig, wäre das mitunter ein gefundenes Fressen – auch für andere Berufszweige wären dererlei Informationen nicht unerheblich.

Also, entweder aufgepasst, was versendet wird, abheften, was längerfristig benötigt und wichtig ist oder die Dokumente in die Ablage S – wie Shredder. So jedenfalls vernichten wir Adress- und andere Daten, die nicht in den Müll dürfen!

Terroristenkinder

Na? Schon interessant, welche Ausmaße das Ganze langsam annimmt? Die CDU will dem Verfassungsschutz erlauben, auch Daten von Kindern ab 14 – besser noch ab 12 – Jahren zu speichern. Und jetzt kommts: “Ziel sei eine bessere Überwachung terrorverdächtiger Minderjähriger”. Was sind bitte schön “terrorverdächtige Minderjährige”? Etwa diese hier? Dann können (und werden) sie auch gleich alle überwachen.

Langsam müsste man es doch auch in der Bevölkerung peilen, was hier abgeht. Auf der einen Seite faseln die was von Missbrauch von Kindern und sowohl auf der einen, wie auch auf der anderen Seite “missbrauchen” sie die Kinder für ihre Machenschaften.

Das Gesetz soll vor der Sommerpause geändert werden.

Oha – so schnell schon? Und wann soll der Arbeitnehmer-Datenschutz beschlossen werden? Ach erst nach der Wahl?

Man sieht, wo die Prioritäten liegen …

Über den Tellerrand Nr. 6

  1. Dass Daten “niemals” für persönliche Zwecke missbraucht werden, zeigt der Vorfall bei der Deutschen Bahn, wo über 170000 Daten von Angestellten (meine Eltern sind sicherlich auch davon betroffen) für andere Zecke missbraucht wurden, um so deutlicher. Was jetzt bekannt wurde ist, dass der Chef persönlich, Hr. Mehdorn, diese Informationen für private Zwecke genutzt hat.  Mindestens eine Person hatte er genauer durchleuchten lassen, da diese Person ihn wegen eines Steuerdeliktes angezeigt hat. Und eine Entschuldigung oder Information lässt auf sich warten …
    Aber es ist ja alles rechtlich erlaubt und legitim. Und noch einmal – wo Daten sind, egal ob in wirtschaftlicher oder staatlicher Hand, werden diese früher oder später anderweitig verwendet – für was, dass lasse ich offen – denn die “niederen” und unter Umständen kriminellen Beweggründe kann kaum einer erahnen. Vielleicht s0ltten sie mal mit dem BKA oder BND kooperieren, dann können die noch was lernen.
  2. Was man nicht alles mit Biometrie machen will: die EU-Männel und Frauen wollen damit einen sicheren Zahlungsverkehr gestalten, da der Kreditkartenbetrug ein immer drängenderes Problem wird. Ich verweise hier auf den Datenschutz-Blog, der in seinem Fazit es treffend formuliert – biometrische Informationen sind kopier- bzw. fälschbar, mit Fingerabdrücken geht es bereits und der Iris-Scan wird auch nicht mehr lange auf sich warten. All das, was erreicht wird ist eine Erhöhung des Identitätdiebstahls, der es Kriminellen und Institutionen vereinfacht, Zutritt zu gesicherten Informationen und Objekten zu erhalten.
  3. Die Polizei, dein Freund und Helfer: mit Fingerspitzengefühl, ohne den Bogen an “Gewalt” zu überspannen und (un)vollkommen verhältnismäßig ist sie zur Stelle, um “Sünder” ihre Vergehen aufzuweisen …
  4. Alle Kinder sind gleich – einige sind gleicher! Das wussten wir schon lange und nun beweisst England mal wieder aufs Neue, dass es so ist. Schlimm genug, dass es eine Datenbank mit derart vielen Informationen über Kinder gibt, wo Hinz und Kunz sich auch noch “öffentlich” bedienen kann. Schlimmer ist es, dass einige Kinder von Politikern und Prominenten darin nicht auftauchen. Die Eltern sind ja sowieso über alle Zweifel erhaben und müssen geschützt werden – ich verstehe! Abschaffenn dieser Datenbanken schützt eher und schürt auch Vertrauen, aber das begreifen die Politiker nicht, denn es widerspricht ihren Zielen …
  5. Etwas Positives: Die Verfassungsbeschwerde gegen das BKA-Gestz läuft. Ich drücke Twister und uns allen die Daumen.
  6. “Monster”mäßiger Datendiebstahl: 4,5 Millionen geklaute Daten inkl. Passwörter und allem Drum und Dran bei der Monster-Jobbörse in UK. Toll, oder?
  7. Missbrauch vorprogrammiert: Die riesigen Daten aus den Call-Centern, die letztes Jahr einfach so herumgeisterten (und keiner war es gewesen, versteht sich) haben jetzt ihr erstes Opfer gefunden. Eine alte Dame, die nicht einmal das Wort Internet aussprechen kann, geschweige ein internetfähiges Gerät besitzt, soll angeblich sich überall registriert haben und die Gewinnspiel-Fuzzies haben ihr mal knappe 2000 Euro vom Konto abgebucht – ohne Einzugsermächtigung versteht sich!
  8. Wieder einmal die Kripo: Während die eine Seite meint, sie könnten gar nicht dem “Cybercrime” etwas entgegensetzen, da das Know-How, die Technik und das Personal fehlt, fordert die andere Gewerkschaft mehr Befugnisse, insbesondere den vermehrten Einsatz des Bundestrojaners. Es ist interessant zu erfahren, dass auf einmal aus einem Unikat “Bundestrojaner”, welcher für jedes System zusammengestellt und programmiert werden solle, jetzt ein Softwaretool auf einmal existiert, welches binnen weniger Minuten im Einsatz ist. “Beunruhigt zeigte sich der Datenschützer, dass beim Einsatz des Bundestrojaners bisher von speziell anzufertigender Untersuchungssoftware in Form von “Unikaten” die Rede war. Nun erkläre die Kripo, dass ein entsprechender verdeckter Zugriff auf IT-Systeme “innerhalb einer halben Stunde machbar” sei.” Na Leute? Macht es bei euch “Klick”?

Ich wünsche angenehmes Lesen, Überlegen, Diskutitieren und Verinnerlichen!