AI Glossary: Datenmanagement Terms & Definitions

Apache Arrow

Apache Arrow ist ein Open-Source-Framework für Hochleistungs-Datenverarbeitung und -analyse.

Überprüfbarkeit

Nachvollziehbarkeit ist die Fähigkeit, Prozesse oder Daten innerhalb eines Systems auf Einhaltung und Verantwortlichkeit zu überprüfen und nachzuvollziehen.

Cache-Eviction

CE

Cache-Ausschluss ist der Prozess, bei dem gespeicherte Daten aus einem Cache entfernt werden, wenn dieser voll ist oder die Daten nicht mehr benötigt werden.

Cache-Invaliderung

KI

Cache-Invaliderung ist der Prozess des Entfernens oder Aktualisierens veralteter Daten in einem Cache, um die Datenintegrität sicherzustellen.

Chroma-Vektordatenbank

Eine Chroma-Vektordatenbank speichert und verwaltet Farbdaten für Anwendungen in KI und Computergrafik.

Dunkle Daten

Dark Data bezieht sich auf Informationen, die Organisationen sammeln, aber nicht für Analysen oder Entscheidungsfindungen verwenden.

Datenaggregation

Datenaggregation ist der Prozess des Zusammenstellens und Zusammenfassens von Daten aus verschiedenen Quellen für die Analyse.

Datenzuordnung

Datenzuordnung bezieht sich auf den Prozess der Identifizierung der Quelle und des Eigentümers der in KI-Modellen verwendeten Daten.

Datenhändler

Datenhändler sammeln, analysieren und verkaufen persönliche Daten aus verschiedenen Quellen.

Datenkarte

Eine Data Card ist eine kurze Zusammenfassung wichtiger Informationen über einen Datensatz, einschließlich seiner Eigenschaften und Nutzung.

Datenbereinigung

Datenbereinigung ist der Prozess der Identifizierung und Korrektur von Fehlern oder Inkonsistenzen in Datensätzen.

Datenkompression

Datenkompression reduziert die Größe von Daten, um Speicherplatz zu sparen und die Übertragungseffizienz zu verbessern.

Datenkuration

Datenkuratierung ist der Prozess der Verwaltung und Pflege von Daten, um deren Qualität, Zugänglichkeit und Nutzbarkeit sicherzustellen.

Datenwörterbuch

Ein Data Dictionary ist ein strukturierter Speicherort für Metadaten, der Daten-Elemente und deren Beziehungen innerhalb eines Systems definiert.

Datenengineering

Data Engineering umfasst das Entwerfen und Erstellen von Systemen zum Sammeln, Speichern und Analysieren von Daten.

Datenanreicherung

Datenanreicherung verbessert bestehende Daten durch Hinzufügen wertvollen Kontexts aus externen Quellen.

Datenauswertung

Datenextraktion ist der Prozess des Abrufens und Transformierens von Daten aus verschiedenen Quellen für weitere Analysen oder die Nutzung.

Daten Governance

Data Governance ist ein Rahmenwerk zur Verwaltung der Datenverfügbarkeit, -nutzung, -integrität und -sicherheit innerhalb von Organisationen.

Datenharmonisierung

Datenharmonisierung ist der Prozess der Integration von Daten aus verschiedenen Quellen, um Konsistenz und Nutzbarkeit sicherzustellen.

Datenintegration

DI

Datenintegration ist der Prozess, bei dem Daten aus verschiedenen Quellen zu einer einheitlichen Ansicht zusammengeführt werden.

Data Lake

DL

Ein Data Lake ist ein zentrales Repository, das große Mengen an Rohdaten in ihrem ursprünglichen Format speichert.

Data Lakehouse

DLH

Ein Data Lakehouse kombiniert die besten Eigenschaften von Data Lakes und Data Warehouses für effizientes Datenmanagement und Analysen.

Datenherkunft

Datenherkunft bezieht sich auf die Nachverfolgung von Daten, während sie durch verschiedene Prozesse laufen, um Datenintegrität und Compliance zu gewährleisten.

Data Mart

Ein Data Mart ist eine fokussierte Teilmenge eines Data Warehouse, optimiert für bestimmte Geschäftsbereiche oder Abteilungen.

Datenminimalismus

DM

Datenminimalismus ist die Praxis, nur die wesentlichen Daten für Entscheidungen und Analysen zu sammeln und zu verwenden.

Datenmodellierung

Data Modeling ist der Prozess der Erstellung einer visuellen Darstellung von Daten und deren Beziehungen innerhalb eines Systems.

Datenorchestrierung

Datenorchestrierung umfasst die Koordination von Datenworkflows über verschiedene Systeme hinweg, um eine rechtzeitige und genaue Datenverarbeitung sicherzustellen.

Datenparsing

Datenparsing ist der Prozess, bei dem Daten von einem Format in ein anderes umgewandelt werden, um sie lesbar und nutzbar zu machen.