Um die Anonymität von Umfragen zu gewährleisten, wird von vielen Unternehmen der Wunsch geäußert, Ergebnisse erst ab einer bestimmten Anzahl von Teilnehmenden anzuzeigen. Genannt werden willkürlich mal 5, mal 7, mal 10 Personen. Diese Anonymitätsgrenze (auch Anonymitätsschwelle oder Auswertungsschwelle) fühlt sich richtig an, stammt jedoch weder aus der Marktforschung noch aus der Statistik. Manche Umfragetools haben diese Forderung unkritisch implementiert und erzeugen damit ein falsches Sicherheitsgefühl – und unnötigen Datenverlust. Entscheidend für die Anonymität ist nämlich nicht, wie viele Personen eine Frage beantworten, sondern wie viele Personen diese Frage hätten beantworten können. In den folgenden Abschnitten erfahren Sie, weshalb eine Anonymitätsgrenze und eine Mindestteilnehmerzahl nicht zielführend sind, und worauf Sie stattdessen achten sollten, um bei der Ergebnis-Auswertung die Anonymität zu gewährleisten.
Als allererstes müssen die möglichen Grundgesamtheiten (also die tatsächlichen Gruppengrößen) ermittelt werden. Dies gilt in jedem Fall, auch unabhängig davon, ob ein Umfragetool irgendeine Form von „Mindestteilnahme“-Funktion anbietet.
Ganz konkret, hier eine mögliche Vorgehensweise:
Quasi-Identifikatoren sind die Merkmale, die Personen beschreibbar machen – also die Fragen nach soziodemographischen Merkmalen wie:
| Was sind Quasi-Identifikatoren? |
|---|
|
Quasi-Identifikatoren = soziodemographische Merkmale, die eine Person in der Regel nicht direkt, aber in Kombination erkennbar machen können. Beispiele:
|
Schritt 2: Ermitteln Sie die Größe aller Gruppen, die diese Merkmale bilden
Für jedes Merkmal und jede Kombination dieser Merkmale gilt:
| Mögliche Gruppen ermitteln - Beispielrechnung: |
|---|
|
Kleiner mathematischer Exkurs: Wenn Sie nur 3 Merkmale abfragen (Geschlecht, Alter und Standort), und jedes dieser Merkmale eine Handvoll Ausprägungen hat, dann ergibt sich folgende Rechnung:
Davon ausgehend, dass beliebige Kombinationen zu einer Identifikation der Teilnehmer führen können (und nicht bspw. nur 3er Kombinationen aller Merkmale), so ergeben sich 79 mögliche Gruppen – jede davon kann zu klein sein, um anonym zu bleiben. Schon drei harmlose soziodemographische Merkmale erzeugen 79 mögliche Gruppen – jede davon kann zu klein sein, um anonym zu bleiben. Eine Mindestteilnehmerzahl hat darauf keinerlei Einfluss. Falls wir das Ganze noch um 10 Abteilungen und 8 Rollen erweitern, kommen wir auf 11 879 mögliche Gruppen. Spätestens hier sollten Sie Ihren Fragebogen kritisch hinterfragen. |
Sie haben also die Gruppengrößen ermittelt und festgestellt, dass einige Kombinationen recht große Grundgesamtheiten ergeben (z. B. „männlich + 40–59“) und andere eher klein bleiben (z. B. „divers + Standort B“). Aber was ist klein und wann ist klein „zu klein“?
Leider gibt es keine universell feste Zahl, die immer sicher ist und die Anonymität gewährleistet. Das bestätigen sowohl Fachliteratur als auch aktuelle Studien. Was es stattdessen gibt ist die Empfehlung, einen risikobasierten Ansatz zu wählen und individuell, anhand der Teilnehmerstruktur und der bekannten Daten bestimmte Größen festzusetzen.
Wichtig ist hier keine starre Schwelle, sondern eine nachvollziehbare Entscheidung:
Kann sich eine Person in dieser Gruppe verstecken, oder steht sie faktisch alleine da?
Ob eine Gruppe anonym ist, hängt vom Kontext ab — von den Merkmalen, von der Struktur Ihrer Belegschaft und von möglichen Kombinationen. Eine feste, pauschale Mindestgröße kann dieses Risiko nie zuverlässig abbilden.
Sie haben bereits die Gruppen gebildet und deren Größe gebildet, bzw. sinnvolle Schwellenwerte festgelegt. Nun haben Sie viele Hebel, um die zu riskant kleinen Gruppen zu vermeiden und die Gesamtzahl der Gruppen zu reduzieren.
1. Abgefragte Merkmale oder Ausprägungen reduzieren
Prüfen Sie kritisch, welche Merkmale für die Analyse tatsächlich notwendig sind. Viele Fragebögen enthalten mehr soziodemografische Merkmale als für das konkrete Projekt benötigt – dadurch entstehen viele, sehr kleine Gruppen.
Beispiel: „Rolle“ oder „Betriebszugehörigkeit“ können inhaltlich relevant sein, werden aber häufig einfach routinemäßig abgefragt, selbst wenn sie für die konkrete Fragestellung nicht benötigt werden oder nur sehr kleine Gruppen bilden.
2. Merkmale und Ausprägungen aggregieren – Gruppen vergrößern
Zusammengefasste Ausprägungen reduzieren die Anzahl möglicher Gruppen und vergrößern diese gleichzeitig. Bedenken Sie hierbei die potenziellen Maßnahmen, welche Sie aus Ihrem Umfrageprojekt ableiten können. Sind überhaupt Maßnahmen pro Alterskategorie 40-45 umsetzbar? Falls nicht, aggregieren Sie die Ausprägungen.
Beispiel:
| Gender, Sex, Diversität und Anonymität |
|---|
|
Für Umfragen in englischer Sprache empfiehlt die ESOMAR, nach „gender“ (soziale Identität) und nicht nach „sex“ (biologische Geschlecht) zu fragen. In Deutschland ist es etwas einfacher, denn das Wort „Geschlecht“ deckt beides ab. Nichtsdestotrotz stellt sich die Frage nach den Ausprägungen: nur „männlich“ und „weiblich“ ist nicht inklusiv. Die separate Abfrage nach „divers“ führt jedoch in der Realität (bei Mitarbeiterumfragen) fast immer zu Kleinstgruppen, die nicht anonym auswertbar sind.
Bevor man diese Frage überhaupt stellt, sollte daher geprüft werden, ob das Geschlecht im konkreten Befragungsprojekt überhaupt relevant ist. Die Geschlechtsabfrage gehört zum Standardrepertoire vieler Umfragen, aber auch wenn es in vielen Bereichen Unterschiede zwischen Männern und Frauen gibt, sind diese Unterschiede nicht in jedem Kontext relevant und verändern häufig weder Interpretation noch Maßnahmen.
Unsere Empfehlung: Bieten Sie die Merkmale weiblich, männlich sowie „keine Angabe/andere“ an, denn dies wahrt die Anonymität aller Befragten, reduziert unnötige Daten (Datensparsamkeit) und verhindert nicht auswertbare Kleinstgruppen. Gleichzeitig bleibt die Frage ausreichend inklusiv, ohne die Analyse zu beeinträchtigen. Kommunizieren Sie offen im Vorfeld oder direkt bei der Fragestellung Ihre Entscheidung! |
3. Weniger sinnvoll: Reporting-Funktionen einschränken (keine Rohdaten, keine Filter)
Reporting-Funktionen können zur Identifikation einzelner Personen führen (Stichproben, Rohdatenauswertung, Filtern nach..). Durch Einschränkungen im Reporting lassen sich solche Risiken vermeiden: Filterung oder Rohdatenauswertung lässt sich für Ihren Account deaktivieren. Aber dann erübrigen sich oftmals viele Fragen, bspw. nach dem Geschlecht in Mitarbeiterbefragungen, wenn es in der Auswertung ohnehin nicht sinnvoll differenziert werden kann.
4. Vermeintlich sinnvoll aber über Umwege doch nicht anonym
Beispiel: Eine Bedingung „Wenn Abteilung A, dann Frage nach Geschlecht überspringen“ soll kleine Gruppen schützen, führt jedoch zu neuen Risiken.
Über den Umweg „wer hat diese Frage nicht gesehen?“ lässt sich die Gruppe erneut eingrenzen – und damit potenziell identifizieren.
Beispiel:
Vier Personen geben eine Antwort > Das Tool verlangt fünf. > Ergebnis: Die Daten werden unterdrückt oder im schlimmsten Fall gelöscht.
Diese pauschale Unterdrückung erzeugt:
Besonders problematisch ist dies, wenn die Grundgesamtheit groß ist (z. B. 200 Mitarbeitende in einem Team). Denn dann wäre das Re-Identifikationsrisiko praktisch null – trotz nur 4 Antworten.
Es gibt nur einen Sonderfall, in dem eine Mindestteilnehmerzahl eine Rolle spielt – und der gilt nur unter sehr engen Bedingungen. Eine Mindestteilnehmerzahl ist ausschließlich dann von Bedeutung, wenn alle folgenden Bedingungen erfüllt sind:
Ein Beispiel:
Zu Jahresbeginn wird eine Umfrage gestartet, die das ganze Jahr über geöffnet bleibt. Eine Frage lautet: „Haben Sie 2025 an einer externen Schulung teilgenommen?“
Damit wäre die eine Person eindeutig identifiziert.
Doch statt mit Mindestteilnehmerzahlen zu arbeiten (die häufig falsch oder missbräuchlich eingesetzt werden), haben wir im LamaPoll-Tool eine andere Option implementiert: die Funktion „getrennte Auswertung“.
Wenn absehbar ist, dass am Ende wenige Personen eine bestimmte Antwortoption wählen könnten, kann diese Frage so eingestellt werden, dass sie vollständig getrennt vom Rest ausgewertet wird. Damit stellen wir sicher, dass – selbst falls diese einzelne Antwort später identifizierbar werden sollte – der restliche Fragebogen anonym bleibt und nicht mit dieser identifizierbaren Antwort verknüpft werden kann.
In solchen Fällen ist jedoch auch zu prüfen, ob die Frage inhaltlich wirklich erforderlich ist oder ob die entsprechende Information bereits an anderer Stelle vorliegt. Wenn die Information anderweitig verfügbar ist, muss sie nicht zusätzlich über die Umfrage erhoben werden. Wenn sie dagegen nirgendwo sonst erfasst wird, ist die Frage unproblematisch – selbst dann, wenn später nur eine Person diese Antwortoption wählt.
1. Die bekannte „< X-Fälle-Regel“ ist nicht einmal „umstritten“, sondern nachweislich ungeeignet. Ein kleiner Auszug:
Die Studie „Less than five is less than ideal: replacing the ‘less than 5 cell size’ rule with a risk-based data disclosure protocol in a public health setting“ zeigt klar:
Wissenschaftlich fundierte Methoden wie k-Anonymität , sowie deren Erweiterungen l-Diversity und t-Closeness zeigen ebenfalls:
Keines dieser Modelle arbeitet mit fixen Schwellen wie „5“.
2. Eurostat und Disclosure-Control-Leitfäden
Eurostat und internationale SDC-Richtlinien empfehlen ebenfalls keine festen Mindestfallzahlen. Stattdessen wird ein kontextabhängiger Ansatz gefordert:
3. Zentrale Erkenntnis
Wissenschaft und Statistik sind sich einig: Anonymität hängt wesentlich von der Größe der Grundgesamtheit und von vorhandenen Informationen ab – nicht von der Anzahl der Antworten. Datenschutz entsteht nicht durch eine fixe Teilnehmerzahl, sondern durch die Bewertung des tatsächlichen Offenlegungsrisikos.
Mindestteilnehmerzahlen erhöhen die Anonymität nicht – sie blenden nur Daten aus, erzeugen ein falsches Sicherheitsgefühl und vernichten wertvolles Feedback. Wissenschaftlich ist diese Mindestanzahl nicht begründet: Nicht die Zahl der Antworten entscheidet über Re-Identifikationsrisiken, sondern die Größe der zugrunde liegenden Gruppen.
Wer echte Anonymität gewährleisten will, muss deshalb nicht Antworten ausblenden, sondern die Grundgesamtheiten prüfen, Kleinstgruppen vermeiden, Merkmale sinnvoll aggregieren und unnötige soziodemografische Fragen weglassen. Etablierte, international anerkannte Datenschutzmethoden stützen diesen Ansatz: Anonymität entsteht durch kontextabhängige Bewertung und intelligente Datenaufbereitung – nicht durch starre Fallzahlregeln.
Mindestteilnehmerzahlen sind somit keine Schutzmaßnahme, sondern eine bequeme, aber wirkungslose Heuristik. Ein risikobasierter, methodisch sauberer Ansatz ermöglicht es dagegen, sowohl den Datenschutz zu wahren als auch die Stimme jeder Person sinnvoll in die Analyse einzubeziehen.
Jetzt Online Umfrage erstellen
Was ist LamaPoll?
LamaPoll ist ein Online Umfrage Tool zum Erstellen von Mitarbeiterfragungen bzw. Umfragen zur Mitarbeiterzufriedenheit. Mit uns können Sie alle Arten der Mitarbeiterbefragung erstellen, durchführen und auswerten.
Erstellen Sie in wenigen Schritten Ihre Mitarbeiterumfrage, passen Sie das Corporate Design Ihres Unternehmens an, laden Sie Ihre Mitarbeiter bequem per E-Mail oder via Intranet ein. Sie sammeln in kürzester Zeit Erkenntnisse zur Steigerung der Mitarbeiterzufriedenheit. Melden Sie sich bei unserem Online Umfrage-Tool kostenlos an. Anschließend können Sie Befragungen bzw. Umfragen für bis zu 50 Mitarbeiter sofort und unverbindlich durchführen. Benötigen Sie mehr Beantwortungen für den Fragebogen Ihrer Online-Mitarbeiter-Umfrage, nutzen Sie einfach unsere Monatstarife. Es stehen Ihnen auch unsere Vorlagen & Beispiele für Fragebögen für Mitarbeiterbefragungen zur Verfügung.
Kontakt