Millionen Daten schlummern ungenutzt auf Servern und in Rechenzentren. Sie werden als „Dark Data“ bezeichnet. Ihre finanziellen und ökologischen Kosten sind zwischenzeitlich so hoch, dass das Problem nicht mehr ignoriert werden kann.
Laut einer vom Softwarehaus MEGA International in Auftrag gegebenen Studie des Instituts Enterprise Strategy Group verdoppelt sich die Datenmenge in Unternehmen alle zwei Jahre. Heute produziert die Wirtschaft weltweit 1,3 Mrd. Gigabyte Daten pro Tag.
Viele sind Dark Data, also „kalte“ oder „vergessene“ Daten. Sie werden sehr selten oder nie aufgerufen und genutzt. Generiert werden sie durch eine Vielzahl von Interaktionen zwischen den IT-Nutzer:innen in Unternehmen und Organisationen. Es handelt sich um Serverprotokolldateien, Geolokalisationsdaten, E-Mails samt Anhängen usw.
Mit der Ausweitung der Cloud und der zunehmenden Nutzung von vernetzten Objekten (IoT) beschleunigt sich die Produktion dieser ungenutzten Daten weiter. Der Dark-Data-Bericht 2019, veröffentlicht von TRUE Global Intelligence im Auftrag des Softwarehauses Splunk, bezifferte ihren Anteil auf 52 % vom weltweiten Gesamtaufkommen.
Gesalzene Rechnung
Diese Daten häufen sich auf Firmenservern und in Rechenzentren an und verursachen so beträchtliche Kosten – laut einer Studie der amerikanischen Beratungsfirma International Data Corporation (IDC) etwa 2 Mrd. US-Dollar pro Monat. Hinzu kommen hohe und weiter steigende Umweltkosten: laut einer Veritas-Untersuchung belasteten Dark Data 2020 die Atmosphäre mit 6,4 Mio. Tonnen CO2, das entspricht dem Ausstoß eines Autos, das 575.000 Mal die Erde umrundet.
Dabei verursacht die IT bereits heute 4 % der Treibhausgasemissionen: Rechenzentren haben mit 2,5 % der Gesamtemissionen einen größeren CO2-Fußabdruck als die Luftfahrtindustrie (2,1 %).
Auch ein dritter Aspekt verdient die Aufmerksamkeit des Managements: Diese hohe Datenmenge verursacht immer mehr Schwachstellen, welche die IT-Sicherheit im Unternehmen bedrohen.
Fehlendes Problembewusstsein
Für die Wirtschaft hat das Thema offensichtlich keine Priorität. „Wer übernimmt die Verantwortung für die Löschung dieser Daten? Niemand möchte den ersten Schritt machen. Häufig ist es einfacher, alles zu behalten“, bedauert Cor Bonda, Lead Consultant Data & Analytics bei Axians Niederlande.
„Es muss eine Datenmanagementpolitik umgesetzt werden, die von allen im Unternehmen geteilt wird. Aber es muss vom Bedarf ausgegangen werden, nicht von den Daten selbst.”
Dabei wäre es wirklich an der Zeit, sich ernsthaft damit zu befassen, zumal die Energiepreise und damit auch die Speicherkosten in den Rechenzentren explodieren. Ganz zu schweigen von Verordnungen über den Umgang mit personenbezogenen Daten wie die DSGVO, die eine Befristung der Datenspeicherung vorschreiben.
Aber häufig haben Unternehmen und insbesondere KMU kaum Ressourcen, um Daten aufzufinden. „Oft wissen sie nicht einmal, dass sie Dark Data horten! Also müssen sie erst einmal identifiziert werden“, bemerkt Bonda. Dann geht es ans Sortieren: kalte Daten, die gespeichert bleiben sollen, verwertbare Daten und Daten zur endgültigen Löschung.
Welche Lösungen gibt es?
„Dafür muss vom Bedarf ausgegangen werden, nicht von den Daten selbst. Das erfordert eine Datenmanagementpolitik, die von allen im Unternehmen geteilt wird“, rät der Lead Consultant Data & Analytics von Axians Niederlande. Er fügt hinzu: „Am wichtigsten ist es jedoch, weniger Daten und somit auch weniger Dark Data zu generieren.“
Mitarbeiterschulungen, regelmäßige Audits zur Identifizierung und Löschung von Dark Data, die Erstellung einer Datenlandkarte und eines Verzeichnisses der Verarbeitung personenbezogener Daten, um ihren Lebenszyklus zu verfolgen, können dazu beitragen. Das Aufspüren, Identifizieren und Sortieren von Daten kann durch künstliche Intelligenz optimiert werden.
Die KI ist potenziell ein interessantes Tool zur Verwertung von Dark Data. Sie kann nämlich zu einer signifikanten Verbesserung von Kundenkenntnis und -beziehung beitragen, indem sie bisher weit verstreute Kundendaten stärker nutzt und einsetzt.
19/10/2023