Nachdem im ersten Teil der Salesforce Data Cloud Serie die Entstehung und Relevanz der Data Cloud erläutert wurde, widmen wir uns nun ihrem Datenmodell und den zentralen Konzepten, bevor wir ihre technische Architektur im dritten Teil weiter beleuchten.
Objekttypen der Data Cloud
Als eine der jüngeren Innovationen des CRM-Marktführers Salesforce stellt die Data Cloud eine hochperformante Lösung zur Verwaltung und Analyse heterogener Daten dar.
Als nächsten Näherungsschritt werfen wir zunächst einen detaillierten Blick auf die drei Hauptobjekttypen, die ihre technische Architektur prägen: das Data Source Object (DSO), das Data Lake Object (DLO) und das Data Model Object (DMO).
Data Source Object (DSO)
Der Import von Daten in die Data Cloud aus verschiedenen Quellen basiert auf deren Anbindung über quellenspezifische Konnektoren. Salesforce ermöglicht hierbei nicht nur die Integration eigener Plattformen wie Sales Cloud oder Marketing Cloud, sondern bietet auch Verbindungen zu externen Data Lakes wie Amazon S3, Google Cloud Storage und Azure Storage. Für Datenquellen, die nicht durch Standardkonnektoren abgedeckt sind, stehen Mulesoft-Konnektoren, SFTP-Integrationen und Ingestion-APIs zur Verfügung. Einmal angebunden, strömen die Daten der Quellen als sogenannte Data Streams in die Data Cloud. Ein Data Stream dient dabei nicht nur der Einspeisung von Daten, sondern auch deren Kategorisierung und Strukturierung. Jeder Datenstrom bildet dabei beliebige Teilmengen spezifischer Entitäten aus einer Data Source ab. Es ist also nicht notwendig, alle Daten einer Quelle zu importieren; vielmehr lassen sich gezielt einzelne Data Streams erstellen, die nur ausgewählte Datenströme repräsentieren.
Im nächsten Schritt landen diese Daten in Data Source Objects (DSO), wo sie im nativen Format des jeweiligen Data Streams in einer temporären Staging Area gespeichert werden. Das DSO bietet hier bereits grundlegende Stream-Processing-Funktionen, mit denen Transformationen und Formeln direkt auf eingehende Daten angewendet werden können, um diese schon beim Eintritt in die Data Cloud zu verarbeiten und anzureichern.
Data Lake Object (DLO)
Nach dem Initialimport und der Vorverarbeitung im DSO werden die Daten in Data Lake Objects (DLO) zentral gespeichert. Das DLO stellt somit eine langfristige Speicherebene der Data Cloud dar und ermöglicht die dauerhafte Bereitstellung und Verwaltung der verarbeiteten Daten. Die Data Cloud bietet mit dem Data Explorer ein benutzerfreundliches Tool zur Verwaltung und zum Zugriff ihrer Daten. Dem Windows Explorer ähnlich, ermöglicht das Tool, gespeicherte Dateien zu durchsuchen und zu organisieren, ohne dass tiefgehende technische Kenntnisse erforderlich sind.

Das DLO – auf technischer Basis von Metadata Stores – kann somit entweder Ansichten auf extern vorgehaltene Daten von Partnern des Data Cloud Zero Copy Partner Networks oder auf spaltenorientierte Parquet-Dateien im zugrundeliegenden Data Lake bereitstellen.
Im Gegensatz zu klassischer Full-Copy Datenintegration, bei der Daten dupliziert werden, ermöglicht Salesforce mit der Zero Copy Integration eine Zugriffslösung, bei der Daten physisch unverändert bleiben. Dies bedeutet für Unternehmen, die Vorteile eines konsolidierten Datenzugriffs nutzen können, ohne die Speichereffizienz zu beeinträchtigen.
Data Model Object (DMO)

Die Daten verschiedener DLOs können in einem Data Model Object (DMO) zu einem einheitlichen, virtuellen View auf den Data Lake kombiniert werden. DMOs bieten eine harmonisierte Sicht auf die Daten und ermöglichen die Zusammenführung von Attributen aus verschiedenen DLOs.
Durch Calculated Insights, also benutzerdefinierte Berechnungen und Transformationen, lassen sich die Daten im DMO weiter anpassen und auf bestimmte Geschäftsanforderungen zuschneiden. Die Abfragen auf DMOs basieren stets auf aktuellen Daten der zugrundeliegenden DLOs, wodurch das DMO eine dynamische Datenansicht für die Data Cloud als Customer Data Platform darstellt. Ähnlich wie Salesforce-Objekte, spiegeln DMOs mit vordefinierten Attributen das standardisierte Customer 360 Datenmodell wider, welches allerdings auch um benutzerdefinierte Objekte erweiterbar ist.
Integration mit der Salesforce-Plattform
Die tiefe Integration in die Salesforce-Plattform verleiht der Data Cloud einen entscheidenden Vorteil: Unternehmen können Echtzeit-Transformationen und -Aktionen nutzen und dadurch schnell gezielt auf Kundeninteraktionen reagieren.
Die neuen Data Model Objects (DMOs) bieten die Möglichkeit, Daten nahtlos zu segmentieren und direkt in Zielumgebungen zu aktivieren oder sofort für Automatisierungen in der Data Cloud zu nutzen. So können Unternehmen ihre Daten nicht nur umfangreich speichern, sondern auch in Echtzeit nutzen – sei es durch die KI-gestützten Funktionen der Plattform wie Agentforce oder andere angebundene Services.
Im kommenden Abschnitt tauchen wir tiefer in die Architektur der Data Cloud ein. Wir werden uns ansehen, wie die Data Cloud auf einer modernen „Lakehouse“-Architektur aufbaut und welche innovativen Technologien zum Einsatz kommen, um eine leistungsstarke, skalierbare Dateninfrastruktur zu schaffen.
- Sie interessieren sich für unsere Services rund um Salesforce Data Cloud? Besuchen Sie unsere Salesforce Themenseite!