How to make companies share truthful data
Although companies are increasingly sharing and reusing data with others to enhance business opportunities, most business-to-business (B2B) data sharing networks are still in their infancy. Important questions about accountability for the quality of the data being shared remain unanswered. This article describes the challenges as well as leading examples of how to address them.
Tags:
governance
collaboration

B2B data sharing networks

Data sharing networks usually have a strong industry focus, with agriculture, data-generating driving, manufacturing and telecom towing the line. They come to life and are operated in one of four ways:

The challenge of data quality

The value of a data sharing network corresponds to the quality of its data. So how is the validity of the shared data being ensured? And how are participants punished for sending bad data? Especially if data is provided “manually” by the participant, rather than sent automatically through a verified device, and if companies have an incentive to provide false data, for example to paint themselves in a positive light or to disrupt the competition, these questions must be addressed. 

In practice however, these questions around data quality often remain unanswered. Instead, many networks choose to invest only in their participant-onboarding processes and rely on the assumption that bad apples are blocked from joining the network in the first place. The reasoning goes that if a company has been properly vetted, they can be blindly trusted to submit high-quality data. Onboarding processes can take many forms, ranging from manual, even face-to-face processes, or state-of-the art unified digital identity processes (e.g. eIDAS). But even the most fine-grained identity check cannot ensure that the network will not be poisoned with inaccurate or even plainly false data. Monitoring and sanctioning mechanisms are essential to make sure that data quality is transparent and high. The remainder of this article will present good practice of monitoring and sanctioning processes.

Good practice in data monitoring

Data monitoring mechanisms for B2B data sharing networks include complaints mechanisms, audit, random sampling and even monitoring of all data.

What actually constitutes false data is a separate topic: Networks need to decide which checks need to be passed for data to be declared valid. If benchmarking data is available this can be used to look for outliers. Other good practices can be borrowed from e-commerce, where businesses look for patterns that might indicate fraudulent payment behavior. For example, when a shopper is using multiple different IP addresses or is shopping from various geo locations or addresses, recurring too often within a short time-frame, or has a low solvency score, these could all be indicators of fraud. 

Complaints mechanisms

Members of a data sharing network can flag potential violations to a centralised body, designated to handle complaints or disputes. The ISEAL Alliance, a global membership organisation for “ambitious, collaborative and transparent sustainability systems”, even mandates that all of its members have such a centralised complaints mechanism in place.

It is recommended that complaints can be submitted anonymously and free of charge: If the submission of complaints is not as frictionless as possible, the network might end up with a suspiciously clean record of zero complaints. This is the case, for example, for the Aluminium Stewardship Initiative. Depending on the nature of the complaint, complaint handling bodies can initiate a guided dialogue between the parties, which could be followed with a formal investigation if needed. In some cases, however, such as whistleblower scenarios, a dialogue might be counter effective.
   

​Verification of outliers

Even though complaints mechanisms are usually thought to be a manual process, they can be re-imagined to some extent in a technical, automated manner: Network members could configure the bounds of expected data submissions for records they are familiar with. For example, in the case of a car manufacturing data network, member A would know the boundaries of the reasonable cost for manufacturing a certain type of engine. If Member B submitted a cost far lower than expected, member A could be notified and automatically or manually flag the suspicious data to a complaints body. 

Audits

Networks can go a step further by instating auditing bodies. These check up on the members’ behaviour on the network and internal processes on fixed or random intervals. They could be scheduled (such as in the Aluminium Stewardship Initiative) or unannounced.

Random sampling 

Similar to the unannounced audits, some data submissions could randomly be checked for veracity and accuracy, whereas the randomness is a parameter to be set by the network (for example: every one in ten submissions). This can be handled by a centralised body (Aluminium Stewardship Initiative), or by the network participants themselves (GAIA-X). 

Monitoring all data

The most stringent, but also most resource-consuming option is to validate each individual datapoint submitted to the network. 

There are not many networks which choose to centrally validate every data submission. The Carbon Energo.gov platform, a combined effort by the Republic of Kazakhstan and the World Bank, is an example. This online platform was launched to handle monitoring, reporting and verifying emission sources and greenhouse gases. It was launched in 2018, at which point there were only seven ​​verification companies accredited in Kazakhstan, with five more in the accreditation process. Since then the project seems to have disappeared off the map. 

Validating each data point is more feasible in a decentralised, technical setting. In this case, networks might need to accept a delay in transaction speed, since the validation of each transaction will cost additional computation power. For example,ReBloc is a blockchain-based data-sharing platform that focuses on the real estate market. ReBloc has introduced an interesting decentralised validation concept (however, it is not clear whether it is currently used in practice). They distinguish between the roles of data-sharing party (Enricher) and Validator. When an Enricher submits data to the network, this data is automatically pulled into a smart contract. At the same time, a quorum of Validators with access to similar data is selected. The smart contract automatically pulls the benchmarking data from the Validator databases, and compares the data points to see whether the submitted data falls within the expected pattern. 


ReBloc works with monetary incentives: Both the Enricher and the Validator send a stake along with their data, which they are at risk of losing if the data or their validation-decision is deemed inaccurate. Enrichers are compensated for the data they sell, Validators stand to earn with their validation decisions.  

In general, if data monitoring is decentralised, networks need to decide upfront whether it would be considered beneficial or harmful if members who are somehow involved, for example because they operate within the same value chain or are competitors, were to monitor each other. 

Good practice in sanctioning

B2B data sharing networks largely use one or more of the same sanctions to penalize members who send bad data. These are outlined below from least to most severe. 

Reputation loss

Reputation is known to be a powerful motivator. Reputation scoring has mostly been studied and applied in a B2C setting but has equal applicability in the B2B world, where it can function as a decentralised sanctioning method. According to a Brightlocal study, 75% of consumers say they trust a company more if it has positive reviews, whilst 60% state that negative reviews made them not want to use a business. Marketplaces such as AirBnB, eBay, Amazon, Uber, Glassdoor all rely heavily on reputation scoring mechanisms and have invested large amounts of research into getting the maximum value out of their reputation rules. 

In B2B data sharing, reputation scoring could take many forms. Networks who follow the classical approach of letting members rate and review each other can draw inspiration from the tech unicorns. They need to make sure to set the parameters right: should reviews be open or blind, editable and or deletable, anonymous or identifiable, should the reviewee be allowed a response, etc. For blockchain based networks, each failed transaction would be logged on chain and made publicly visible to all members, resulting in a reputation mechanism of its own.

Temporary suspension or loss of certificate

Members who have been found guilty of submitting low-quality data (and e.g. obtained a bad reputation score as a consequence), could be temporarily banned from the network as a second-degree sanction. Networks using certifications could withdraw the certificate from a Member, whilst allowing them to stay on the network (examples include Aluminium Stewardship Initiative and ISEAL Alliance). 

Permanent loss of membership

Loss of membership is seen as the ultimate sanction by most networks. However, this approach is not feasible if a loss of any member significantly weakens the network as a whole. 

Legal action

Sanctioning can even be taken outside the boundaries of the network by relying on existing legal structures. Some networks provide Master Agreements to govern the relationship between data sender and recipient, which include relevant clauses regarding data usage limitations, security, confidentiality, privacy, and forcing the data sender to guarantee the accuracy and veracity of their data. If data is found to be purposefully false, the Agreement is violated, which constitutes a basis for legal action. This approach is recommended by the EU Commission in their Guidance on sharing private sector data in the European data economy and applied by the FOT-Net Automated Driving Data Sharing Framework

Which are the important questions?

Although there are some practical approaches to data validity monitoring and member sanctioning, it still remains a topic which is often overlooked by B2B data sharing networks. These networks should address several questions to decide on the best approach: 

General

  • What type of data is being shared?
  • Do members have a possibility and/or an incentive to share bad data?
  • What does the member vetting or onboarding process look like?
  • How are members incentivized to join the network, and how do they benefit from sharing data? 

Monitoring

  • Should data monitoring be handled by a centralized body or by the members themselves?
  • In a decentralized setting: are the monitoring members rewarded for their efforts? Do they have an incentive to validate low-quality data, or invalidate high-quality data?
  • Would data monitoring be handled in a technical or non-technical manner?
  • Should all submitted data-points be monitored or only some? If only some: should the checks be random or should outliers be reviewed?
  • Are audits feasible?

Sanctions

  • Are certificates being issued to members and could these be withdrawn as a sanction?
  • Can members be temporarily prevented from participating (selling or buying data up to suspension), without significantly hurting the network?
  • Can members be permanently banned without significantly hurting the network?
  • Would members be willing to risk losing money (e.g. staking)?
  • Would potential reputation loss work as a deterrent? Can a good reputation be tied with positive consequences?

The answers to these questions can help guide the Network to the ideal approach to member accountability for the validity of data. 

back to library
About Us
We are a diverse group of specialists with academic and entrepreneurial backgrounds that are driven by a shared vision: to solve the current data sharing dilemma for the better. Please find our full founding vision in our manifesto.
For Members
Do you want to shape how data is being shared in a post-platform economy with us?

We welcome any individual with any background.
For Universities
Do you want to bridge the gap between your research and various industries?

We help you to connect to companies and to turn your research into action.
For Companies
Do you want to evaluate the potential if you start sharing your data with other companies in your ecosystem?

We help you to define a ecosystem strategy, to connect with other companies and to gain significant efficiency gains by sharing your data with others.
Please feel free to get in touch!
contact
Imprint
SINE e.V.
c/o Martin Pompéry
Bredowstr. 35a, 10551 Berlin
Email: Vorstand@sine.foundation
Represented by the board (Vorstand): Aurel Stenzel, Martin Poméry, Aline Blankertz, Karina Buschsieweke.
Registration number: Applied
VAT number: Applied
Tax ID: Applied
Responsible for any journalistic and editorial content on this website according to 55 para.2 RStV: Aurel Stenzel, Görschstr. 14, 13187 Berlin.

Disclaimer: As a service provider, Sine e.V. is responsible for its own information, which is offered on this website, in accordance with section 3 para.1 and section 7 para.1 of the German Telemedia Act (TMG). However, Sine e.V. has no control over the content, the data protection guidelines or the practices of websites or services of third parties and assumes no responsibility for this (see § 8 TMG). Sine e.V. is neither directly nor indirectly responsible or liable for damage or loss caused by or in connection with the use or reliance on such available content, goods or services on such websites and services.

July 2020
privacy policy

Datenschutzerklärung Sine e.V.

§ 1 Information über die Erhebung personenbezogener Daten

(1) Im Folgenden informieren wir über die Erhebung personenbezogener Daten bei Nutzung unserer Website. Personenbezogene Daten sind alle Daten, die auf Sie persönlich beziehbar sind, z. B. Name, Adresse und E-Mail-Adresse.

(2) Verantwortlicher gem. Art. 4 Abs.7 EU-Datenschutz-Grundverordnung (DS-GVO) ist SINE e.V., Görschstr. 14, 13187 Berlin, vorstand@sine.foundation, vertreten durch den Vorstand Aurel Stenzel, Aline Blankertz, Karina Buschsieweke, Martin Pompéry.

(3) Wir verarbeiten personenbezogene Daten unserer Nutzer grundsätzlich nur, soweit dies zur Bereitstellung einer funktionsfähigen Website sowie unserer Inhalte und Leistungen erforderlich ist. Die Verarbeitung personenbezogener Daten unserer Nutzer erfolgt regelmäßig nur nach Einwilligung des Nutzers. Eine Ausnahme gilt in solchen Fällen, in denen eine vorherige Einholung einer Einwilligung aus tatsächlichen Gründen nicht möglich ist und die Verarbeitung der Daten durch gesetzliche Vorschriften gestattet ist.

(4) Bei Ihrer Kontaktaufnahme mit uns per E-Mail über das Kontaktformular (“Contact me Button”) werden die von Ihnen mitgeteilten Daten (Ihre E-Mail-Adresse, ggf. Ihr Name und Ihre Telefonnummer, sofern Sie uns diese mitteilen) von uns gespeichert, um Ihre Fragen zu beantworten. Die in diesem Zusammenhang anfallenden Daten löschen wir, nachdem die Speicherung nicht mehr erforderlich ist, oder schränken die Verarbeitung ein, falls gesetzliche Aufbewahrungspflichten bestehen.

(5) Falls wir für einzelne Funktionen unseres Angebots auf beauftragte Dienstleister zurückgreifen oder Ihre Daten für Werbezwecke nutzen möchten, werden wir Sie untenstehend im Detail über die jeweiligen Vorgänge informieren.


§ 2 Ihre Rechte

(1) Sie haben gegenüber uns folgende Rechte hinsichtlich der Sie betreffenden personenbezogenen Daten:

• Recht auf Auskunft nach Art. 15 DS-GVO: Sie können Auskunft über die Verarbeitungszwecke, die Kategorien der personenbezogenen Daten, die verarbeitet werden, die Kategorien von Empfängern, gegenüber denen Ihre Daten offengelegt wurden oder werden, die geplante Speicherdauer, das Bestehen eines Rechts auf Berichtigung, Löschung, Einschränkung der Verarbeitung oder Widerspruch, das Bestehen eines Beschwerderechts, die Herkunft ihrer Daten, sowie über das Bestehen einer automatisierten Entscheidungsfindung einschließlich Profiling zu verlangen;

• Recht auf Berichtigung gemäß Art. 16 DS-GVO: Sie können unverzüglich die Berichtigung unrichtiger oder Vervollständigung Ihrer bei uns gespeicherten personenbezogenen Daten verlangen;

• Recht auf Löschung gemäß Art. 17 DS-GVO: Sie können die Löschung Ihrer bei uns gespeicherten personenbezogenen Daten verlangen, es sei denn, die Verarbeitung zur Ausübung des Rechts auf freie Meinungsäußerung und Information, zur Erfüllung einer rechtlichen Verpflichtung, aus Gründen des öffentlichen Interesses oder zur Geltendmachung, Ausübung oder Verteidigung von Rechtsansprüchen stehen dem entgegen;

• Recht auf Einschränkung gemäß Art. 18 DS-GVO: Sie können die Einschränkung der Verarbeitung Ihrer personenbezogenen Daten verlangen, soweit die Richtigkeit der Daten von Ihnen bestritten wird, die Verarbeitung unrechtmäßig ist, Sie aber die Löschung ablehnen, wir die Daten nicht mehr benötigen, Sie jedoch diese zur Geltendmachung, Ausübung oder Verteidigung von Rechtsansprüchen benötigen oder Sie gemäß Art. 21 DS-GVO Widerspruch gegen die Verarbeitung eingelegt haben;  

• Recht auf Datenübertragbarkeit gemäß Art. 20 DS-GVO: Sie können verlangen, dass Sie Ihre personenbezogenen Daten, die Sie uns bereitgestellt haben, in einem strukturierten, gängigen und maschinenlesebaren Format erhalten oder dass wir die Daten an einen anderen Verantwortlichen übermitteln.


• Recht auf Widerspruch gemäß Art. 21 DS-GVO: Sie können Widerspruch gegen die Verarbeitung erheben, sofern Ihre personenbezogenen Daten auf Grundlage von berechtigten Interessen gemäß Art. 6 Abs. 1 Satz 1 lit f. DS-GVO verarbeitet werden. Dazu müssen Gründe vorliegen, die sich aus Ihrer besonderen Situation ergeben. Ein solcher Widerruf beeinflusst die Zulässigkeit der Verarbeitung ihrer personenbezogenen Daten, nachdem Sie ihn gegenüber uns ausgesprochen haben.


(2) Sie haben zudem das Recht, sich bei einer Datenschutzaufsichtsbehörde über die Verarbeitung Ihrer personenbezogenen Daten durch uns zu beschweren. In unserem Fall ist das die Berliner Beauftragte für Datenschutz und Informationsfreiheit unter https://www.datenschutz-berlin.de/


§ 3 Erhebung personenbezogener Daten bei Besuch unserer Website

(1) Bei der bloß informatorischen Nutzung der Website, also wenn Sie sich nicht registrieren oder uns anderweitig Informationen übermitteln, erheben wir nur die personenbezogenen Daten, die Ihr Browser an unseren Server übermittelt. Wenn Sie unsere Website betrachten möchten, erheben wir die folgenden Daten, die für uns technisch erforderlich sind, um Ihnen unsere Website anzuzeigen um einen reibungslosen Verbindungsaufbau und eine komfortable Nutzung der Website zu gewährleisten sowie zur Auswertung der Stabilität und Systemsicherheit. Rechtsgrundlage ist dabei Art. 6 Abs. 1 S. 1 lit. f DS-GVO. Unser berechtigtes Interesse basiert auf den genannten Zwecken zur Datenerhebung. IP-Adresse Datum und Uhrzeit der Anfrage   User Agent String, der den Browser oder das Betriebssystem für den Server identifiziertinstallierte Schriftarten MIME-TypenSprache  und Zeitzone der BrowsersoftwareSilverlight Dateninstallierte Plugins HTTP HeadersBildschirmauflösung
Die Daten werden gelöscht, sobald sie für die Erreichung des Zweckes ihrer Erhebung nicht mehr erforderlich sind. Im Falle der Erfassung der Daten zur Bereitstellung der Website ist dies der Fall, wenn die jeweilige Sitzung beendet ist.


(2) Zusätzlich nutzen wir das Produkt Plausible Analytics. Plausible verfolgt für uns die Messung der Nutzung unserer Website, allerdings ohne einen Cookie zu setzen und ohne personenbezogene Daten von den Nutzern zu erheben. Plausible Analytics erhebt allein folgende aggegrierte Daten: URL Referrer (d.h. Website, von der die Anforderung kommt) Browser (z.B. “Firefox”)Operating System (z.B. “iOS”)Device type (z.B. “Desktop” oder “Smartphone”)Land (z.B. “Deutschland”) Keiner der genannten Datenpunkte sind personenbezogen und keine Person kann durch die genannten Datenpunkte identifiziert werden. Für mehr Informationen über Plausible Analytics klicken Sie bitte hier.


§ 4 Erhebung personenbezogener Daten beim Online Beitrittsformular

Wenn Sie unserem Verein via unserem auf unserer Website zur Verfügung gestellten Online Beitrittsformular beitreten, erheben wir im Weiteren folgende Daten von Ihnen: Vor- und NachnameAdresseEinwilligung zur Datenverarbeitung hinsichtlich des BeitrittsFerne besteht die Möglichkeit in unseren Newsletterversand (siehe hierzu § 6) einzuwilligen. Die genannten Daten werden ausschließlich zum Zweck der Mitgliederverwaltung und -betreuung verarbeitet und bis zum Austritt eines Mitgliedes bei uns gespeichert bzw. solange es gesetzliche Aufbewahrungsfristen erfordern. Es erfolgt keine Weitergabe an Dritte.


§ 5 Weitergabe von Daten an Dritte

Wir geben Ihre persönlichen Daten nur an Dritte weiter, wenn die Weitergabe nach Art. 6 Abs. 1 S. 1 lit. f DS-GVO zur Geltendmachung, Ausübung oder Verteidigung von Rechtsansprüchen erforderlich ist und kein Grund zur Annahme besteht, dass Sie ein überwiegendes schutzwürdiges Interesse an der Nichtweitergabe Ihrer Daten haben. Ferner in dem Fall, dass für die Weitergabe nach Art. 6 Abs. 1 S. 1 lit. c DS-GVO eine gesetzliche Verpflichtung besteht, sowie falls es gesetzlich zulässig und nach Art. 6 Abs. 1 S. 1 lit. b DS-GVO für die Abwicklung von Vertragsverhältnissen mit Ihnen erforderlich ist.Eine Übermittlung Ihrer persönlichen Daten an Dritte zu anderen als den genannten Zwecken findet nicht statt.


§ 6 Newsletter

Auf unserer Webseite besteht die Möglichkeit einen kostenfreien Newsletter zu abonnieren. Dabei werden bei der Anmeldung zum Newsletter die Daten aus der Eingabemaske an uns übermittelt, d.h. ihre Emailadresse sowie ihr Vor- und Nachname.  
Wir verwenden zum Versand des Newsletters Cleverreach GmbH & Co. KG, mit welchen wir einen Auftragsverarbeitungsvertrag nach Art. 28 DS-GVO geschlossen haben. Für den Versand des Newsletters verwenden wir das Double Opt-In-Verfahren. Dazu erhalten Sie den Newsletter erst, wenn Sie uns ausdrücklich bestätigt haben, dass Sie den Newsletter erhalten möchten. Es erfolgt im Zusammenhang mit der Datenverarbeitung für den Versand des Newsletters keine Weitergabe der Daten an Dritte. Die Daten werden ausschließlich für den Versand des Newsletters verwendet. Die E-Mail-Adresse des Nutzers wird solange gespeichert, wie das Abonnement des Newsletters aktiv ist. Das Abonnement des Newsletters kann durch den betroffenen Nutzer jederzeit gekündigt werden. Zu diesem Zweck findet sich in jedem Newsletter ein entsprechender Link.Rechtsgrundlage für die Verarbeitung der Daten nach Anmeldung zum Newsletters durch den Nutzer ist bei Vorliegen einer Einwilligung des Nutzers Art. 6 Abs. 1 lit. a DS-GVO.


§ 7 Änderungen der Datenschutzerklärung

Wir behalten uns das Recht vor, unsere Datenschutzerklärung zu ändern falls dies aufgrund neuer Technologien oder neu eingesetzter Dienstleister notwendig sein sollte. Werden an dieser Datenschutzerklärung grundlegende Änderungen vorgenommen, geben wir diese auf unserer Website bekannt.