Was sind eigentlich Daten? Und was ist Information?

18.12.2023

Zusammenfassung

Seit mehr als einem Jahrzehnt beschäftigen wir uns mit der Frage: Was sind eigentlich Daten und was ist Information? Der Beitrag geht dieser Thematik nach, die wir in einer dreiteiligen Video-Serie behandelt haben.

8 Minuten Lesezeit

Klimaängste, Pandemie, Ukraine-Krieg, wir leben in Zeiten schlechter Nachrichten und Furcht. Eine Reduzierung der allgemeinen psychischen Gesundheit ist den Forschenden und auch den Krankenversicherungen inzwischen bereits aufgefallen. Man registriert besonders hohe Krankenstände im Gesundheitswesen, sowie in der öffentlichen Verwaltung. Senioren, junge Erwachsene, aber ganz besonders Kinder leiden unter einer zunehmend durch Ängste bestimmten Wahrnehmung. Angst ist die stärkste Emotion, die den Menschen lenkt.

Sie finden im Anschluss die Begründung und Zusammenfassung eines Vorschlages, wie der Datenschutz vereinfacht und konkretisiert werden könnte mit dem möglichen Ergebnis, dem Kernbereich menschlicher Existenz etwas mehr Schutz zukommen zu lassen.

Für das Jahr 2024 wünschen wir allen, dass Besinnung, Mut und Zuversicht für die vor uns liegende Zukunft wieder mehr in den Vordergrund treten werden.

Begriffe nicht klar definiert

Vielleicht zur Überraschung des einen oder anderen sind die Begriffe Information, vor allem jedoch Daten, und damit der eigentliche Schutzgegenstand der Datenschutzgrundverordnung (DSGVO) nicht klar bestimmt.

Wir wollen schildern, welche unterschiedlichen Deutungs-Ansätze es zu diesen Begriffen gibt und schließen mit einem eigenen Vorschlag, wie diese Begriffe künftig klarer gefasst werden könnten, auch um aufgrund der rasant voranschreitenden technologischen Entwicklung die Begriffsdefinition für Daten wirksamer zu gestalten.

Wir schicken voraus: Bei Daten handelt es sich um Materie

Erstens: Jede Maschine benötigt, um arbeiten zu können, etwas Konkretes, materiell Vorhandenes. Ohne Materie erfolgt keinerlei Verarbeitung. Visionen, Ideen und Dergleichen, also substanzlose Vorstellungen können maschinell nicht verarbeitet werden. Maschinen verarbeiten Daten auf ihrer physikalisch existenten Ebene. Der Computer ist eine Maschine. Ein Computer verarbeitet Daten daher auf materieller Ebene.

Zweitens: Daten sind messbar. Was messbar ist, muss physikalisch existent sein.

Drittens: Funkwellen, Licht sowie der Elektromagnetismus sind dem Bereich der elektromagnetischen Wechselwirkung als eine der vier physikalischen Grundkräfte zugehörig. Elektromagnetismus, Funkwellen, Licht: das sind genau jene Bereiche, in denen sich die Datenverarbeitung abspielt. Jede Form der Verarbeitung, Speicherung sowie Transport von Daten findet in diesem Umfeld statt.

Das hierbei zugrunde liegende Elementarteilchen ist das Photon. Im nur theoretisch möglichen Ruhezustand hat ein Photon keine Masse. Tatsächlich aber bewegt es sich mit Lichtgeschwindigkeit.

Die hier angedeutete, enorme Komplexität des Umfeldes von Daten und ihre anspruchsvollen Antworten sind womöglich der Grund, warum sich nicht nur Juristen mit dem Begriff der Daten und seiner materiellen Verfasstheit schwertun.

Datenverarbeitung und Software

Um die physisch vorhandenen Daten verarbeiten zu können, bedarf es Verarbeitungsanweisungen, die wir als Software bezeichnen. Für die Datenverarbeitung wird dabei zwischen zwei möglichen Zuständen differenziert. Diese werden oft als „on“ oder „off“, „0 = nicht magnetisiert“, sowie „1 = magnetisiert“, als „an“ oder „aus“ oder als „0 oder 1“ bezeichnet.
Diese zwei möglichen Zustände führten zur Begriffs-Schöpfung der „binären“ Datenverarbeitung.

In der aktuellen Datenverarbeitung werden aus entweder „0“ oder „1“ also jeweils einem Bit, durch eine Aneinanderreihung von insgesamt 8 Bits insgesamt 256 Zeichen (2 hoch 8 = 256). Vertiefend veranschaulicht wird das Thema übrigens im Deutschen Museum hier in München, in der Abteilung der Geschichte der Digitalisierung anhand der Zuse-Maschine.

Aneinanderreihungen von jeweils 8 Bits, die dann als Byte bezeichnet werden, sind die Ausdrucksform von Software. Letztlich also eine Aneinanderreihung der beiden möglichen magnetischen Zustände mit dem Ziel, aufgrund deren materieller Gegebenheit Datenverarbeitung zu betreiben.

In Software lässt sich vieles, also nun auch physisch nicht existentes ausdrücken, beispielsweise Gefühle, Vermutungen, Phantasie-Erlebnisse in Form von Texten, Geräuschen Bildern. Somit erfolgt eine Transformation aus einer wohl nur dem Menschen zugänglichen, substanzlosen Welt der Gedanken und Eindrücke per Software auf die physikalisch-materielle Ebene der Datenverarbeitung durch einen Computer. Diese Transformation führt womöglich ebenfalls zu Missverständnissen, weil dabei die physikalische, also materielle Verfasstheit der Daten verwischt wird.

Per Software gelangen sowohl mathematisch beschreibbare, technisch konkrete, aber auch körperlose Erwägungen, Wertungen, Informationen, Vermutungen auf die Ebene der naturwissenschaftlich-mathematisch arbeitenden, materiellen Datenverarbeitung.

Rechtliches Umfeld von Daten und Information

Befassen wir uns nun mit dem rechtlichen Umfeld, in denen die Begriffe Daten und Information Verwendung finden. Menschen sind grundsätzlich frei, Begriffe für Innovationen zu erfinden, um diese inhaltlich zu konkretisieren, mit Bedeutung anzureichern. So etwa funktioniert Sprache.

Wenn wir uns zu naturwissenschaftlichen Erscheinungen äußern, so dürfte das Ziel darin bestehen, ein allgemeines Verständnis dieser Begriffe konsensual zu verfestigen und nach und nach mit ihrer naturwissenschaftlich begründbaren Verfasstheit zu vereinen.

Bei Begriffen, wo sich der naturwissenschaftliche Kontext nicht herstellen lässt oder nicht hergestellt werden soll, wird es bei einer Näherung der Begriffe, und damit der Sprache bleiben müssen. Nur beispielhaft erwähnt seien hier: Wert und Würde.

Der Begriff Daten allerdings, das haben wir im ersten Teil gezeigt, ist naturwissenschaftlich fassbar und sollte damit auch klar und eindeutig beschrieben werden können.

Wir leben im Informationszeitalter, in dem alles durch Datenverarbeitung durchzogen ist. Die zugrundeliegenden Kernbegriffe „Information“ und „Daten“, die wir regulativ zu erfassen suchen, sind nicht einheitlich und klar definiert.

Blicken wir nach Deutschland, in welchem im Jahre 1983 das Datenschutzrecht historisch durch das „Informationelle Selbstbestimmungsrecht“ stark geprägt wurde. Im hierauf dann aufbauenden Bundesdatenschutzgesetz wurden die Begriffe „Daten“ und „Information“ noch getrennt, auch wenn diese Begriffe nicht klar definiert wurden.

Keine klare Begriffstrennung in der DSGVO

Diese Begriffstrennung ist mit der Datenschutzgrundverordnung dann endgültig verloren gegangen, in dem die Datenschutzgrundverordnung in Artikel 4 definiert, dass „personenbezogene Daten“ all jene „Informationen“ seien, die Rückschluss auf eine identifizierte oder identifizierbare, natürliche Person zulässt.

In der Rechtsprechung werden Daten gelegentlich als flüchtig betrachtet, also nicht materiell verfasst, zudem leicht kopierbar und damit nicht eigentumsfähig. Es findet keine klare Trennung von der Information als eine lediglich durch menschliche Wertung bestimmte Erkenntnis-Ebene statt.

Beispielhaft sei auf die vorhandene Begriffsvielfalt durch das Projekt von Herrn Veil verwiesen, welcher die Schutzgüter aufzählt, die in der politischen Diskussion der letzten Jahre mit der DSGVO in Verbindung gesetzt wurden.

Die Unschärfe in der Verwendung von Begriffen ermöglicht zwar Pragmatismus durch eine angepasste Auslegung, allerdings eben doch auf Kosten der Verständigung.

Eine Definition für Daten, orientiert an ihrer tatsächlichen Natur: diese fehlt. Ersatzweise behilft man sich, indem man sich gegenseitig versichert, im Grunde doch zu wissen, was gemeint sei.

Auch andere Wissenschaftsbereiche, also nicht nur Juristen, haben Schwierigkeiten bei der klaren Begriffsfindung in dem Bereich. So gibt es Publikationen in den Wirtschaftswissenschaften, die ebenfalls keine ganz klare Begriffstrennungen vorgenommen haben.

Selbst die Elektrotechnik verwendet die Begriffe teilweise synonym. Die DIN-Gesellschaft, das liegt allerding schon Jahre zurück, hatte einen Vorschlag für eine Begriffsdefinition und Klarstellung des Daten- Begriffs unterbreitet, diesen dann aber wieder zurückgezogen.

Situation des Datenschutzrechts

In welcher Situation befinden wir uns aktuell im Datenschutzrecht, wo einige schon das Scheitern der DSGVO konstatieren?

Nun, die Industrie bemängelt die Komplexität des Datenschutzrechts. Ferner sagen sie, dass diese Regulierung dafür verantwortlich sei, dass die Wirtschaft im Vergleich zu anderen Regionen wie China, USA, den Anschluss an die technologische Spitze verlieren würde.

Wiederum andere beklagen, dass die Politik nicht die ausreichenden Ressourcen zur Verfügung stellen würde, das Datenschutzrecht flächendeckend durchzusetzen.

Wir erleben ferner eine technologisch rasante Entwicklung, zu der uns die IT-Fachleute fehlen, diese entsprechend in die Praxis umzusetzen.

Zeitgleich sehen sich Firmen und der Staat Hackerangriffen in ungekanntem Ausmaß ausgesetzt, für die es im Ergebnis keine wirklich passenden Gegenmittel gibt.

Wir können festhalten, der liberale Staat verliert in diesem Bereich seinen Kompetenzanspruch.

Unklarheiten bei den Begriffen Daten und Information hinsichtlich der Datenschutzgrundverordnung und die offenen Fragen beim eigentlichen Schutzgegenstand, der datenschutzrechtlichen Regulierung, tragen zu dem Nebel bei, in dem sich das Regulierungs-Ansinnen für die digitale Industrie als zukünftig zentraler Kernbereich der wirtschaftlichen Weiterentwicklung hierzulande befinden.

Beispielhaft sei der aktuelle Umgang mit neuen Informationstechniken der künstlichen Intelligenz genannt und die Versuche, dem regulativ in irgendeiner Weise zu begegnen.

Es sei am Rande das Beispiel Google erwähnt, welches bestimmte KI-Technologien in Europa für Betatests gar nicht mehr zur Verfügung stellt.

Zur Frage der Eigentumsfähigkeit von Daten

Abschließend noch ein paar Worte zur Frage der Eigentumsfähigkeit der Daten. In der Literatur wird immer wieder gesagt, Daten seien nicht eigentumsfähig, insbesondere im Hinblick auf ihre mangelnde materielle Verfasstheit und ihre Flüchtigkeit, gemeint ist dabei jedoch ihre Kopierbarkeit.

In gleichem Zeitpunkt diskutiert die Europäische Kommission Gesetzesvorhaben zur Schaffung eines Datenrechts, in welchem nicht personenbezogenen Daten einen eigentumsrechtlichen Status zusprechen möchte.

Aus den genannten Gründen haben wir bereits 2021 Klage vor dem Verwaltungsgericht Köln erhoben. Stand Jahresbeginn 2023 waren dort noch 50 Verfahren vor uns. Wir sollen nicht mehr nachfragen.

Ziel ist es, nach Möglichkeit den EuGH mit der Frage zu befassen, was Daten sind, ob sie materiell verfasst sind und ob sich daraus eine Eigentumsfähigkeit dieser Daten ergibt.

Vorschlag zur Weiterentwicklung des Datenschutzrechts

Wir erleben derzeit eine rasante technologische Fortentwicklung. Zum einen das Aufkommen von künstlicher Intelligenz, insbesondere der „Large Language Models“ (LLM). Hierbei handelt es sich um eine auf statistischen Modellen beruhende Aufarbeitung von Buchstabenfolgen.

Der Datenschutz oder das Datenschutzrecht tun sich schwer, ihren Regelungsanspruch in Bezug auf diese „Large Language Modelle“ aufrechtzuerhalten. Im Moment greift man noch auf die Vorstellung zurück, dass bereits das Anlernen eines Large Language Moduls je nach Daten Art dem Datenschutzrecht zu unterziehen sei.

Bei der Interaktion mit einem LLM führen bereits der Inhalt der Frage, sowie die Art der Fragestellung zu Rückschlüssen auf die Person des Fragenden selbst. Mit anderen Worten, jeder sprachliche Austausch mit einem Large Language Modell führt potenziell zu Erkenntnissen, mit denen sich das Large Language Modell anreichern kann.

Ganz ähnlich wie beim Gehirn: eine einmal gewonnene Erkenntnis, aufgelaufenes Wissen kann nicht einfach auf Befehl wieder entfernt oder gelöscht werden. Jede Interaktion mit einem Large Language Modell führt zu Anreicherungen und könnte entsprechend analysiert werden.

Die vorherrschende Angst über die künftige Unterlegenheit des Menschen unter künstliche Intelligenz, sofern diese irgendwann Bewusstsein erlangen könnte, ist also irreführend.

Denn die Einbeziehung des Menschen und die sich daraus ergebenden Analysen erfolgen bereits über die Sprache. Erlangtes Bewusstsein ist für Large Language Modelle keine Voraussetzung, um den Anfragenden analysieren zu können. Der bloße sprachbasierte Austausch genügt hierfür bereits.

Noch ein zweiter Bereich der technologischen Entwicklung neben künstlicher Intelligenz, den ich erwähnen möchte. Es geht um die Nutzung biometrischer Informationen, insbesondere zur Authentifizierung von Log-in-Vorgängen bei Social-Media-Plattformen.

Die Vorteile hinsichtlich der eindeutigen Identifizierung eines Nutzers liegen klar auf der Hand.

Klar auf der Hand liegen aber auch die Nachteile aus Sicht des Datenschutzes. Es könnte mehr als kritisch sein, hier auf identifizierende Merkmale wie beispielsweise einen Iris-Scan zu setzen. Gerade die Iris erlaubt Rückschlüsse auf den Gesundheitszustand einer Person.

Nach diesem Streifzug in die technologischen Entwicklungen einige Überlegungen zu den rechtlichen Rahmenbedingungen für Persönlichkeitsrechte und Datenschutz im Bereich der Europäischen Union.

Zum einen das Recht auf informationelle Selbstbestimmung aus dem Urteil des Bundesverfassungsgerichts aus dem Jahr 1983, korrespondierend mit Artikel 8 der Europäischen Menschenrechtskonvention. Zum anderen das Übereinkommen aus dem Jahr 1981 zum Schutz des Menschen bei der automatisierten Verarbeitung personenbezogener Daten.

Dann der insbesondere für Anwendungen im Bereich Künstlicher Intelligenz relevante Artikel 22 der DSGVO, welcher automatisierte Einzelentscheidungen entsprechend einschränkt. Zum Schluss die Charta der Grundrechte der Europäischen Union. Dort ist neben dem Artikel 8, der den Schutz personenbezogener Daten ganz explizit behandelt auch relevant Artikel 5. Dieser beinhaltet ein Verbot von Sklaverei und Zwangsarbeit. Artikel 5 schützt also die physische Existenz eines Menschen.

Bei dem hier diskutierten Datenbegriff nun geht es um den Schutz und die psychische Existenz, um den Schutz der geistigen Verfasstheit eines Menschen.

Diese zu ergreifen, zu lenken, ist nicht minder bedeutsam, weil jede Fremdverwendung das Potential hat, für das gelenkte Individuum unentdeckbar zu bleiben, was für dieses zwar unbemerkt, aber keineswegs folgenlos bleiben wird.

Auch die Beschreibung der geistigen Ausformung eines Menschen kann in fremde Hände geraten und damit unter die Kontrolle der falschen Kräfte gelangen.

Daten können die geistige und psychische Verfasstheit eines Menschen beschreiben, seine Verhaltensweisen, seine Neigungen identifizierbar und damit verwendbar machen.

Unbemerkte Lenkung von Menschen

Es können Kenntnisse über eine Person erhoben werden, die zur Steuerung und zur unbewussten Lenkung des Menschen verwendet werden können, ohne dass dies der betroffenen Person bewusst werden kann. Die Bestätigung des Menschen in seiner eigenen, vorab ermittelten Blase ermöglicht eine unbemerkte Übernahme und Lenkung seines Willens.

Dem Verbot der körperlichen Fremdbestimmung aus Artikel 5 der EU-Charta sollte ebenfalls eine Unterbindung der auf das Unterbewusstsein des Menschen abstellende, dessen Willen aushebelnde Technik an die Seite gestellt werden.

Fazit

Wir sprachen von Daten mit dem gemeinsamen Merkmal, allesamt dem Bereich der elektromagnetischen Wechselwirkung, eine der vier Grundkräfte der Physik zugehörig zu sein. In diesem Umfeld werden Daten verarbeitet und genutzt. Wir hatten gezeigt, dass derartige Daten materiell sein müssen. Auf dieser Grundlage könnte der Datenschutz weiterentwickelt werden.

Einige Voraussetzungen erscheinen hilfreich.

Daten werden aufgrund ihrer Materialität als eigentumsfähig anerkannt.
Daten, die eine Person beschreiben, sind ausschließlich dieser Person zugehörig.
Derartige Daten dürften nicht veräußerbar sein, sie dürften nicht zur Lenkung einer Person eingesetzt werden.
Verstöße dagegen sollten strafbar sein.

Wer immer derartige Daten aus welchem Grund auch immer erhebt oder erhoben hat, er darf diese Daten nicht nutzen. Es wird freilich Ausnahmen geben, beispielsweise für den medizinischen Bereich.

Eine auf das Unterbewusstsein zielende Fremdsteuerung von Individuen, von Menschen, von Bürgern kann entgegengetreten werden, indem man den Kern von personenbeziehbaren Daten – in Ergänzung der den Körper schützenden Verbote – jeder allgemeinen Nutzung entzieht, indem diese Kerndaten dem jeweiligen Individuum als ein unveräußerliches Eigentum zuerkannt werden und man jede Nutzung solcher Daten unter Strafe stellt.

Autor: Eckehard Kraska

Hier finden Sie unsere Videos zu der YouTube-Reihe „Daten und Information“

Teil 1: Gedanken zur Beschaffenheit von Daten sowie deren Verarbeitung (Dauer: 6:06 Min.)

Teil 2: Das rechtliche Umfeld. Juristische Betrachtungen (Dauer: 7:48 Min.)

Teil 3: Vorschläge zur Weiterentwicklung des Datenschutzrechts (Dauer: 8:00 Min.)

Über den Autor - Rechtsanwalt Dr. Sebastian Kraska

Herr Dr. Sebastian Kraska gründete die IITR Datenschutz GmbH, die auf den Bereich des betrieblichen Datenschutzes spezialisiert ist und als Anbieter von Datenschutz-Management-Systemen Unternehmen bei der Bewältigung datenschutzrechtlicher Anforderungen unterstützt.

Herr Dr. Kraska selbst ist als Rechtsanwalt ausschließlich im Datenschutzrecht sowie gemeinsam mit Regionalpartnern als externer Datenschutzbeauftragter tätig und betreut dabei Unternehmen und Behörden. Er ist zudem Beirat der Zeitschrift ZD des Beck-Verlages.

Kontakt: