Diesmal möchte ich auf einen interessanten Artikel zum Thema PDF/A hinweisen. Natürlich etwas positiv eingefärbt, da der Author Geschäftsführer eines Softwareanbieters rund um PDF/A ist. Aber als Übersicht und Einblick sehr gut...
"Sollte man denn so viel "Wind" um den PDF/A Standard und das PDF/A Competence Center machen. Schließlich ist PDF/A ja nur ein minimaler Teil eines ECM-Systems", so eine Meinung zum Thema PDF/A Standard. Thomas Zellmann fällt dabei immer eine circa 200-seitige Ausschreibung einer nicht ganz kleinen deutschen Behörde ein, in der das Thema Archivformate nur eine halbe Seite beanspruchte. Er vergleicht ein ECM-System ganz gerne mit einem Haus, und da bilden Dokumentformate das Fundament, auf dem das gesamte ECM-Haus stehen muss. Deshalb ist es auch so wichtig, hier eine fundierte Entscheidung zu treffen. Und aus Sicht des PDF/A Competence Center kann eine solche nur positiv für PDF/A ausfallen, weshalb auch entsprechender "Wind" gemacht werden muss.
Denn mit PDF/A als ISO-Standard für die Langzeitarchivierung haben Unternehmen und Verwaltungen die Sicherheit, dass ihre Dokumente langfristig lesbar erhalten bleiben. Sie entsprechen somit gesetzlichen Anforderungen und haben gleichzeitig die Sicherheit, dass digital abgelegte Informationen über Jahrzehnte hinweg verfügbar bleiben. Nehmen wir mal die Banken und Versicherungen, die als Vorreiter bei der Nutzung von elektronischen Dokumentensystemen gelten. Sie verwalten und archivieren ihre gescannten Briefe, ausgefüllte Formulare, Bilder von Schäden und Verträge digital. Dementsprechend besteht eine digitale Kundenakte aus zahlreichen Dateien mit unterschiedlichen Formaten.
Man kann quasi von einem Format-Zoo sprechen. Die Konsequenz: Sachbearbeiter, die eine Kundenakte mit Fotos, E-Mails, Formularen und Anschreiben durchsehen wollen, müssen umständlich zwischen verschiedenen Viewern hin- und herschalten. Zusätzlich stellt sich hier die Frage, wie lange beispielsweise ein Word-Dokument oder eine Excel-Kalkulation noch lesbar ist. Wenn man bedenkt, dass die Aufbewahrungspflicht für eine Kredit- oder Versicherungsakte mindestens fünfzig oder mehr Jahre beträgt, wobei das Papier in der Regel vernichtet wird und somit nur noch eine digitale Kopie existiert, dann muss die zukünftige Lesbarkeit sichergestellt sein.
Woher kommt PDF/A und was sind seine speziellen Eigenschaften?
Beschäftigen wir uns zunächst mit der Frage, woher PDF/A eigentlich kommt. PDF ist in der Geschäftswelt ein äußerst beliebtes Datenformat. Um zu verhindern, dass Unternehmen für die Langzeitarchivierung eigene Unterdialekte von PDF erzeugen, war ein Standard notwendig. Dieser sollte sicherstellen, dass PDF-Dokumente langfristig lesbar erhalten bleiben. Mit anderen Worten: Es bestand Bedarf nach einem "guten PDF-Format":
Die Initiative für ein solches "gutes PDF-Format" kam von dem internationalen Anwenderverband AIIM (Enterprise Content Management Association) und der NPES (National Printing Equipment Association, die sich inzwischen als Association for Suppliers of Printing, Publishing, and Converting Technologies beschreibt). Sie haben bereits im Oktober 2002 eine Arbeitsgruppe ins Leben gerufen. Diese Arbeitsgruppe setzte sich aus Vertretern der Forschung, der öffentlichen Hand und der Wirtschaft zusammen. Dazu zählen Adobe, Appligent, EMC, Global Graphics, die Harvard Universität, IBM, das nationale Staatsarchiv der USA NARA, die Library of Congress, Merck & Co., das Patent- und Markenamt der USA, PDF Sages und US-Gerichte. Einige der Spezialisten waren bereits bei der ersten PDF-Standardisierung, dem PDF/X-Format beteiligt. Dieses dient zum Austausch von Druck- und Anzeigendaten in der Verlagsindustrie. Aus dieser Arbeitsgruppe entstand sehr bald das PDF/A-Normungskomitee in der ISO (ISO TC 171). Hierdurch kamen Vertreter nationaler Normungsinstitute in der Folge zum PDF/A-Normungsgremium dazu.
Die Standardisierung erfolgte auf Basis fundamentaler Ansprüche an ein Dateiformat für die Langzeitarchivierung. Daraus resultierten die speziellen Eigenschaften, über die das Format heute verfügt.
Dazu zählen:
- Geräte-, Software- und Versionsunabhängigkeit, so dass die Inhalte immer gleich dargestellt werden.
- "Self Contained", beinhaltet alle Komponenten, die zur Darstellung nötig sind, in der Datei.
- "Self Documented", die Dateien beschreiben sich inhaltlich und dokumentieren sich selbst über wiederum standardisierte Metadaten.
- Transparenz, eine PDF/A-kompatible Datei ist mit einfachen Mitteln analysierbar.
Im Herbst 2005 verabschiedete die International Organization of Standardization (ISO) PDF/A (A steht sinnigerweise für Archive) als Standard "ISO 19005-1" für die Langzeitarchivierung. Dieser ist auf 36 Seiten mit sehr viel Technik beschrieben und kann über www.iso.org gekauft werden. Der PDF/A-Standard basiert übrigens auf der PDF Version 1.4, die Adobe im Zuge des Prozesses auch offengelegt hat. Er verbietet u.a. die Verwendung von externen Inhalten, Skripts oder Verschlüsselungen. Durch die formale Anerkennung der ISO wurde PDF vom De-facto-Standard, also aufgrund seiner häufigen Verwendung und Akzeptanz zu einem De-jure-Standard erhoben.
Der PDF/A ISO Standard ist in die Level PDF/A-1a und 1b unterteilt. PDF/A-1b (Level B Conformance) beschreibt die Mindestanforderungen zur Übereinstimmung mit PDF/A. Es bildet die Basis, die von den meisten PDF/A-Produkten unterstützt wird.
PDF/A-1b stellt sicher, dass der Text (wie auch der übrige Seiteninhalt) korrekt angezeigt werden kann, garantiert aber nicht, dass der enthaltene Text auch lesbar und verständlich ist. Damit ist die Übereinstimmung mit dem Abschnitt 508 des "US Rehabilitation Act" nicht gewährleistet.
PDF/A-1a ergänzt im Wesentlichen zwei Funktionen, nämlich die Unicode-Unterstützung und sogenanntes Tagged PDF. Tagged PDF unterstützt insbesondere die Barrierefreiheit. Es beschreibt die semantische oder logische Struktur eines PDF und stellt damit sicher, dass die natürliche Leseordnung des enthaltenen Texts erhalten bleibt.
Die Textextraktion ist vor allem dann wichtig, wenn die Dokumente beispielsweise auf mobilen Geräten (wie beispielsweise einem PDA) oder auf Geräten gemäß dem oben genannten Abschnitt 508 dargestellt werden sollen. In solchen Fällen muss der Text auf dem eingeschränkten Bildschirm neu angeordnet werden können (re-flow).
Die Praxis hat gezeigt, dass 1b für die meisten Anwendungen ausreichend ist. Im Scan- oder im Output-Bereich ist 1a nur mit sehr hohem manuellem Aufwand zu erreichen.
Quelle und gesamter Artikel: documanager.de
Online-Bookmark und Suche mit: