Was tun, wenn man Hunderte verschiedener Dokumente zuverlässig gegen eine bestimmte Vorlage testen muss, die zu prüfenden Dateien in Länge und Struktur aber nicht identisch sind? Herkömmliche Tools ermöglichen einen automatisierten Dokumentenvergleich nur dann, wenn Referenzdokument und Kandidatdokument exakt dieselbe Anzahl an Seiten haben.
Besser, weil flexibler sind 1:n-Vergleiche. Das Prinzip: Eine Ausgabedatei von beliebiger Länge und mit unterschiedlichen Seitentypen wird mit einem vorgegebenen Template Seite für Seite verglichen. Der Vorteil dieser „one-to-many“-Methode: Vorlage (Referenzdokument) und Prüfdatei (Kandidatdokument) müssen hinsichtlich Umfang und Typ der Seiten nicht identisch sein. Somit lässt sich ein zu prüfendes Dokument mit Hunderten von Einzelseiten gegen ein Template von nur wenigen Seiten mit absoluter Sicherheit und Genauigkeit prüfen.
Wichtig: Es genügt nicht, Dokumente nur auf visueller Ebene miteinander zu vergleichen. Denn die Analyse auf Pixelebene bringt wenig, wenn von 1.000 gefundenen Abweichungen tatsächlich nur fünf relevant sind. Vielmehr geht es auch um den Objekt- und Textvergleich, das heißt, der Vergleich muss auf Bit-Ebene erfolgen, denn etliche Abweichungen lassen sich mit bloßem Auge nicht erkennen.
Daher: Gefragt sind Lösungen, die eine größtmögliche Toleranz bei der Prüfung erlauben, ohne die absolute Korrektheit in Inhalt, Corporate Identity (Fonts, Layout etc.) und Compliance (gesetzliche Auflagen) zu vernachlässigen (Fuzzy-Methodik).