Archivierung

Digitales Langzeitarchiv in Österreich nimmt Gestalt an

Das digitale Langzeitarchiv der Republik Österreich könnte bereits Ende 2009 in Betrieb gehen. Die Ausschreibung für das Projekt sei für die kommenden Wochen geplant, so Michael Freitter, Zuständiger im Bundeskanzleramt für E-Government. Als erster Schritt ist die digitale Erfassung der Bestände des Staatsarchivs geplant. Alle relevanten Akten der Ministerien sollen auf Jahrhunderte hinaus gesichert werden.

Die Aktenbestände aller öffentlichen Dienststellen sollen in dem Langzeitarchiv der Republik gespeichert werden. Der Server dafür befindet sich in St. Johann im Pongau, wo der Hochsicherheits-Datenspeicher des Bundes steht.

Um sicherzugehen, werden die Daten allerdings auch noch in einem alten Atombunker in Wien Erdberg gespeichert. Das sehen die strengen Kriterien für die Archivierung solcher Daten vor. Dazu kommt noch: Die zwei Speicher müssen in unterschiedlichen Erdbebengebieten liegen.

Bettina Kann, Leiterin des Bereichs Digitale Bibliothek der Österreichischen Nationalbibliothek, erklärt die Schwierigkeiten, die sich bei der Auswahl der Daten ergeben: "Wir können nicht wissen, was zukünftige Forscher einmal interessieren wird." Diese Fragen beschäftigen derzeit auch ihr Haus. Die Nationalbibliothek will ab kommendem Jahr die Inhalte aller WWW-Seiten, deren Adresse auf ".at" endet, für künftige Generationen archivieren.

Quelle: futurezone.ORF.at

3

Single Instancing - Damit Archivsysteme nicht aus den Nähten platzen

E-Mail-Kommunikation gehört heute zu den unternehmenskritischen Anwendungen. E-Mails und ihre Anhänge enthalten wichtige Informationen, die nicht nur wegen gesetzlicher Vorschriften, sondern auch im eigenen Interesse des Unternehmens sicher verwaltet und archiviert werden müssen. "In der Praxis gibt es allerdings immer noch Firmen und Organisationen, bei denen die Mitarbeiter ihre Mails auf der lokalen Festplatte oder dem Laufwerk ihres Laptops ablegen," berichtet Jürgen Obermann, CEO des Archivierungsspezialisten GFT inboxx. "Selbst wenn diese Daten zentral auf einem Server gespeichert werden, kann es zu Problemen kommen. Mail-Server werden instabil und die Reaktionszeiten immer länger, je umfangreicher die Mail-Datenbanken werden."

Für das rasante Volumenwachstum der Mail-Dateien ist unter anderem das unnötige Ablegen von mehreren Kopien der gleichen Mail und das mehrfache Speichern gleicher Anhänge verantwortlich. "In vielen Firmen versucht man, dieses Problem mit strikter Beschränkung des individuellen Mailboxvolumens unter Kontrolle zu bringen. Damit bekämpft man allerdings nur die Symptome und nicht die Ursachen. Außerdem belastet man die Mitarbeiter mit dem damit verbundenen administrativen Aufwand und kann nicht ausschließen, dass geschäftskritische Mails und Anhänge gelöscht werden."

Wirkliche Entlastung der Mailarchiv-Infrastruktur bringt eine Single Instancing-Lösung, wie sie vom Archivsystem GFT inboxx geboten wird. Hier werden Mails und Anhänge nur einmal abgelegt, auch wenn sie an viele Adressen gehen. "Das Datenvolumen auf den Servern kann so um bis zu 80 % gesenkt werden, was der Stabilität und Zuverlässigkeit des Mailsystems zugute kommt."

Microsoft Exchange bietet zwar auch Single Instancing, allerdings nur solange die Mails auf dem Server liegen. Wird der Nutzer durch die Größenbeschränkung seiner Mailbox gezwungen, die Mails in .pst Dateien auszulagern, geht das Single Instancing von Microsoft Exchange verloren. Dabei werden im System Dateien vielfach dupliziert. "Beim Archivierungskonzept von inboxx besteht keine Notwendigkeit, .pst-Dateien zu erzeugen. Deshalb wird mit diesem Archivierungssystem das Speichervolumen nicht unnötig vergrößert," schließt Obermann.

Ingrid Daschner, Johnson King Ltd.

0

ePDF-Server von GroupWare AG unterstützt Langzeitarchivierung mit PDF/A

Mit dem neuen Release 3.9 unterstützt die „ePDF“-Serverfamilie der GroupWare AG den neuen Standard PDF/A nach ISO 19005-1 für die Langzeitarchivierung von PDF-Dateien.

Wie das Unternehmen mitteilt, ist der Server eine beliebig skalierbare Software, um Dateien nahezu beliebiger Formate im vorhandenen Verzeichnissystem, innerhalb und außerhalb vorhandener Datenbanken, nach PDF zu konvertieren. Durch die nahtlose Integration in den Domino- bzw. Exchange-Server können – netzwerkweit und serverbasiert – Dateianhänge ebenso wie OLE-Objekte in Notes-Dokumenten und Exchange-Ordnern sowie im besonderen das proprietäre Lotus Notes Format selbst, automatisiert und strukturiert umgewandelt, verarbeitet, archiviert und veröffentlicht werden. All diese Formate können in PDF oder direkt in PDF/A überführt, validiert, gestempelt, mit einem Wasserzeichen versehen, verschlüsselt, mit Passwörtern geschützt, verkettet, mit einer Texterkennung behandelt, signiert oder komprimiert (ZIP) und schließlich weiterverteilt werden – immer regelbasiert und vollautomatisch.

0

PDF/A – machen wir aus der Maus einen Elefanten?

Diesmal möchte ich auf einen interessanten Artikel zum Thema PDF/A hinweisen. Natürlich etwas positiv eingefärbt, da der Author Geschäftsführer eines Softwareanbieters rund um PDF/A ist. Aber als Übersicht und Einblick sehr gut...


"Sollte man denn so viel "Wind" um den PDF/A Standard und das PDF/A Competence Center machen. Schließlich ist PDF/A ja nur ein minimaler Teil eines ECM-Systems", so eine Meinung zum Thema PDF/A Standard. Thomas Zellmann fällt dabei immer eine circa 200-seitige Ausschreibung einer nicht ganz kleinen deutschen Behörde ein, in der das Thema Archivformate nur eine halbe Seite beanspruchte. Er vergleicht ein ECM-System ganz gerne mit einem Haus, und da bilden Dokumentformate das Fundament, auf dem das gesamte ECM-Haus stehen muss. Deshalb ist es auch so wichtig, hier eine fundierte Entscheidung zu treffen. Und aus Sicht des PDF/A Competence Center kann eine solche nur positiv für PDF/A ausfallen, weshalb auch entsprechender "Wind" gemacht werden muss.

Denn mit PDF/A als ISO-Standard für die Langzeitarchivierung haben Unternehmen und Verwaltungen die Sicherheit, dass ihre Dokumente langfristig lesbar erhalten bleiben. Sie entsprechen somit gesetzlichen Anforderungen und haben gleichzeitig die Sicherheit, dass digital abgelegte Informationen über Jahrzehnte hinweg verfügbar bleiben. Nehmen wir mal die Banken und Versicherungen, die als Vorreiter bei der Nutzung von elektronischen Dokumentensystemen gelten. Sie verwalten und archivieren ihre gescannten Briefe, ausgefüllte Formulare, Bilder von Schäden und Verträge digital. Dementsprechend besteht eine digitale Kundenakte aus zahlreichen Dateien mit unterschiedlichen Formaten.

Man kann quasi von einem Format-Zoo sprechen. Die Konsequenz: Sachbearbeiter, die eine Kundenakte mit Fotos, E-Mails, Formularen und Anschreiben durchsehen wollen, müssen umständlich zwischen verschiedenen Viewern hin- und herschalten. Zusätzlich stellt sich hier die Frage, wie lange beispielsweise ein Word-Dokument oder eine Excel-Kalkulation noch lesbar ist. Wenn man bedenkt, dass die Aufbewahrungspflicht für eine Kredit- oder Versicherungsakte mindestens fünfzig oder mehr Jahre beträgt, wobei das Papier in der Regel vernichtet wird und somit nur noch eine digitale Kopie existiert, dann muss die zukünftige Lesbarkeit sichergestellt sein.

Woher kommt PDF/A und was sind seine speziellen Eigenschaften?

Beschäftigen wir uns zunächst mit der Frage, woher PDF/A eigentlich kommt. PDF ist in der Geschäftswelt ein äußerst beliebtes Datenformat. Um zu verhindern, dass Unternehmen für die Langzeitarchivierung eigene Unterdialekte von PDF erzeugen, war ein Standard notwendig. Dieser sollte sicherstellen, dass PDF-Dokumente langfristig lesbar erhalten bleiben. Mit anderen Worten: Es bestand Bedarf nach einem "guten PDF-Format":

Die Initiative für ein solches "gutes PDF-Format" kam von dem internationalen Anwenderverband AIIM (Enterprise Content Management Association) und der NPES (National Printing Equipment Association, die sich inzwischen als Association for Suppliers of Printing, Publishing, and Converting Technologies beschreibt). Sie haben bereits im Oktober 2002 eine Arbeitsgruppe ins Leben gerufen. Diese Arbeitsgruppe setzte sich aus Vertretern der Forschung, der öffentlichen Hand und der Wirtschaft zusammen. Dazu zählen Adobe, Appligent, EMC, Global Graphics, die Harvard Universität, IBM, das nationale Staatsarchiv der USA NARA, die Library of Congress, Merck & Co., das Patent- und Markenamt der USA, PDF Sages und US-Gerichte. Einige der Spezialisten waren bereits bei der ersten PDF-Standardisierung, dem PDF/X-Format beteiligt. Dieses dient zum Austausch von Druck- und Anzeigendaten in der Verlagsindustrie. Aus dieser Arbeitsgruppe entstand sehr bald das PDF/A-Normungskomitee in der ISO (ISO TC 171). Hierdurch kamen Vertreter nationaler Normungsinstitute in der Folge zum PDF/A-Normungsgremium dazu.

Die Standardisierung erfolgte auf Basis fundamentaler Ansprüche an ein Dateiformat für die Langzeitarchivierung. Daraus resultierten die speziellen Eigenschaften, über die das Format heute verfügt.

Dazu zählen:

  • Geräte-, Software- und Versionsunabhängigkeit, so dass die Inhalte immer gleich dargestellt werden.
  • "Self Contained", beinhaltet alle Komponenten, die zur Darstellung nötig sind, in der Datei.
  • "Self Documented", die Dateien beschreiben sich inhaltlich und dokumentieren sich selbst über wiederum standardisierte Metadaten.
  • Transparenz, eine PDF/A-kompatible Datei ist mit einfachen Mitteln analysierbar.

 

Im Herbst 2005 verabschiedete die International Organization of Standardization (ISO) PDF/A (A steht sinnigerweise für Archive) als Standard "ISO 19005-1" für die Langzeitarchivierung. Dieser ist auf 36 Seiten mit sehr viel Technik beschrieben und kann über www.iso.org gekauft werden. Der PDF/A-Standard basiert übrigens auf der PDF Version 1.4, die Adobe im Zuge des Prozesses auch offengelegt hat. Er verbietet u.a. die Verwendung von externen Inhalten, Skripts oder Verschlüsselungen. Durch die formale Anerkennung der ISO wurde PDF vom De-facto-Standard, also aufgrund seiner häufigen Verwendung und Akzeptanz zu einem De-jure-Standard erhoben.

Der PDF/A ISO Standard ist in die Level PDF/A-1a und 1b unterteilt. PDF/A-1b (Level B Conformance) beschreibt die Mindestanforderungen zur Übereinstimmung mit PDF/A. Es bildet die Basis, die von den meisten PDF/A-Produkten unterstützt wird.

PDF/A-1b stellt sicher, dass der Text (wie auch der übrige Seiteninhalt) korrekt angezeigt werden kann, garantiert aber nicht, dass der enthaltene Text auch lesbar und verständlich ist. Damit ist die Übereinstimmung mit dem Abschnitt 508 des "US Rehabilitation Act" nicht gewährleistet.

PDF/A-1a ergänzt im Wesentlichen zwei Funktionen, nämlich die Unicode-Unterstützung und sogenanntes Tagged PDF. Tagged PDF unterstützt insbesondere die Barrierefreiheit. Es beschreibt die semantische oder logische Struktur eines PDF und stellt damit sicher, dass die natürliche Leseordnung des enthaltenen Texts erhalten bleibt.

Die Textextraktion ist vor allem dann wichtig, wenn die Dokumente beispielsweise auf mobilen Geräten (wie beispielsweise einem PDA) oder auf Geräten gemäß dem oben genannten Abschnitt 508 dargestellt werden sollen. In solchen Fällen muss der Text auf dem eingeschränkten Bildschirm neu angeordnet werden können (re-flow).

Die Praxis hat gezeigt, dass 1b für die meisten Anwendungen ausreichend ist. Im Scan- oder im Output-Bereich ist 1a nur mit sehr hohem manuellem Aufwand zu erreichen.

Quelle und gesamter Artikel: documanager.de

3.5

Sun: Archivsystem wird Open Source

Den Quellcode für das integrierte Archivsystem Sun Storagetek 5800 alias "Honeycomb" hat Sun Microsystems unter die BSD-Lizenz gestellt und an mehrere Entwicklergemeinden übergeben, darunter die quasi hauseigene Opensolaris Storage Community und Java.net, aber auch die Storage Networking Industry Association (SNIA). Beim Honeycomb-Projekt stehen die Sourcen als knapp 8 MByte große Zip-Datei zum Download bereit.

Honeycomb ist ein "Fixed Content Storage" System, das einmal gespeicherte Daten, etwa Text-, Audio- oder Videodokumente, unverändert vorhält. Nach aktuellen Schätzungen werden 80 % der weltweiten Datenbestände nachträglich nicht verändert – Tendenz steigend. Für das Management solcher Daten entwickelt die SNIA eine neue Programmierschnittstelle namens eXtensible Access method (XAM), die langfristig auch in Honeycomb und Opensolaris Einzug halten soll.

2

Archivierung versus Backup

Desöfteren bemerke ich bei Diskussionen, dass die beiden Fachbegriffe Backup und Archivierung nicht klar voneinander getrennt bzw. teilweise sogar verglichen werden. Ab und zu stellt sich gar jemand die Frage, warum man Archivierung benötigt, wenn man doch entsprechend hochwertige Backup-Lösungen hat.

Daher hier ein kurzer Vergleich der beiden Fachthemen:

Backup Archive
Sekundärkopie einer Information/eines Dokumentes Primäre Kopie einer Information/eines Dokumentes
primär für Recovery genutzt für Information Retrieval vorgesehen
erhöhte Verfügbarkeit, indem Informationen zu/für einem bestimmten Zeitpunkt wieder hergestellt werden kann erhöhte Effizienz durch verschieben der Informationen/Dokumente aus dem unmittelbaren Speicherbereich
kurzfristig (Wochen oder Monate) normalerweise langfristig (Monate, Jahre und sogar Jahrzehnte)
Daten werden regelmäßig überschrieben (z.B. monatlich) Daten bleiben unverändert
für IT-Umsetzung der Compliance nicht geeignet auch auf Compliance ausgerichtet
5

Interview mit Herrn Kainrath, NetApp auf der ITnT 2008

Vom 5.-7. Februar fand die ITnT 2008 statt. Grund genug wiederum eine Interview-Serie mit interessanten Persönlichkeiten des österreichischen ECM-Marktes zu führen.

Mein Gesprächspartner war diesmal Herr Kainrath, Senior Consultant bei NetApp in Österreich. Wir haben folgende Inhalte diskutiert bzw. wurden folgende Fragen gestellt, wobei das Thema Archivierung und Storage ein Schwerpunkt dabei war:

  • Bitte stellen Sie sich und Ihr Unternehmen kurz vor.
  • Was sind die Highlights des auf der ITnT präsentierten Produkt- und Leistungsangebotes?
  • Welche Anwendungsbereiche (ECM-Verticals) sind aus Ihrer Sicht derzeit gefragt? Und welche Branchen investieren derzeit am meisten in ECM-Lösungen?
  • Nennen Sie uns bitte einige aktuelle Referenzen d.h. Kundenprojekte und gehen Sie dabei kurz auf die Projektinhalte ein.
  • Welche Technologien, Standards aber auch Produkte beeinflussen den ECM-Markt derzeit massiv?
  • Wie sehen Sie den österreichischen ECM-Markt? Tendenz fallend, gleichbleibend, steigend, stark steigend?


20:14 Minuten (18.52 MB)
4.75

OPTIMAL SYSTEMS rüstet das Bauarchiv aus

Die DEBA Deutsche Bauarchiv GmbH (DEBA) hat sich für den Einsatz der Enterprise Content Management-Suite OS.5|ECM von OPTIMAL SYSTEMS (OS) entschieden. Die DEBA, Mitglied in der Firmengruppe BAU WERK PLAN, widmet sich seit Ende 2007 als Ausgründung des renommierten Ingenieurbüros Specht, Kalleja + Partner GmbH der Dokumentenlogistik für Unterlagen der Firmengruppe sowie externer Kunden. Sie bietet ihre Dienstleistungen Architekten und Ingenieuren, aber auch über die Baubranche hinaus, an. Die ECM-Plattform von OPTIMAL SYSTEMS wurde Anfang Januar eingeführt.

Die DEBA bietet Dienstleistungen rund um die Archivierung von Bauunterlagen und unterstützt damit Bauherren und Eigentümer, die neuen Richtlinien bezüglich der Aufbewahrung von Unterlagen zu erfüllen. Die Archivierung der Dokumente erfolgt in Papier- sowie in elektronischer Form, dabei werden die Fundorte der Papierakten im Regallager der DEBA mittels Barcodes verzeichnet. Der Archivbestand wird dazu im Enterprise Content Management-System OS.5|ECM erfasst. "Ziel der Einführung von OS.5|ECM war es, den Zugriff auf die Dokumente sowie die Verfügbarkeit der Informationen jederzeit zu gewährleisten. Das ECM-System regelt den Zugriff, die Recherche sowie die Ausleihe von archivierten Unterlagen", so Herr Andreas Kalz, Sales Manager bei OPTIMAL SYSTEMS. "Die technische intuitive Anpassbarkeit und die Flexibilität der OS-Lösung war ausschlaggebend für unsere Entscheidung", erklärt Ben Stoffregen, Geschäftsführer der DEBA.

Seit dem 01.01.2007 verpflichtet die neue Bauverfahrensverordnung (BauVerfVO) Bauherren und Eigentümer für die Aufbewahrung der bei der Erstellung eines Bauwerkes entstandenen Bauunterlagen selbst Sorge zu tragen. Ein Ersatzexemplar dieser Unterlagen bei den Behörden wird es zukünftig nicht mehr geben. Der Zugriff auf die Bauunterlagen soll jederzeit gewährleistet werden - bei Um- oder Anbauten, Abriss, Behördenanforderung oder Verkauf. Sollten die Bauunterlagen beschädigt oder verloren gehen, ist eine Neustellung notwendig, was nur mit sehr hohem Aufwand und sehr hohen Kosten verbunden ist.

4

Archivierungssystem spürt Akten per RFID auf

Das auf Kommunikationstechnik spezialisierte Startup-Unternehmen Raptech hat in Zusammenarbeit mit dem Elektronikinstitut der römischen Universität Tor Vergata ein neuartiges Archivierungssystem entwickelt.

Über das "Archiviatech" können mit Hilfe von Wireless-Techniken abgelegte Schriftstücke oder Akten in kürzester Zeit aufgespürt werden."Die Suche erfolgt im Vergleich zu den bisher üblichen Verfahren durch die Verwendung von RFID- und Zigbee-Chips doppelt so schnell", bestätigen die Dozenten Aldo di Carlo und Paolo Lugli. "Zudem kann kein Dokument verloren gehen. Damit ist Archiviatech bestens für Bibliotheken, den Einzelhandel, Freiberufler, Krankenhäuser und Versicherungen geeignet. Gleichzeitig haben wir eine Methode gefunden, die das Lesen und Beschriften von RFID-Etiketten zu niedrigen Kosten über das Internet möglich macht."

Raptech war vor fünf Jahren mit Unterstützung lokaler Fördergelder entstanden. Das Archiviatech-Projekt hat im vergangenen Jahr den von der regionalen Entwicklungsgesellschaft Filas ausgeschriebenen Preis für Hochtechnologie "InnovaLazio " gewonnen. Zusammen mit den Firmen Sdr, Bsb und BigMama war außerdem das mit Photovoltaikstrom gespeiste Beleuchtunsgsystem "Ecoluce" entwickelt worden, das eine drahtlose Optimierung des Stromverbrauchs ermöglicht und sich besonders für mobile Einsätze wie Openair-Konzerte oder Messeteilnahmen eignet.

Doch die grösste Herausforderung für das aus acht Fachleuten bestehende Team steht noch bevor. Bis Ende dieses Jahres soll ein System zur Marktreife gebracht werden, das die Ortung von Gegenständen und Personen in geschlossener Umgebung ohne das satellitengestützte GPS-Signal ermöglicht.

Quelle und gesamter Artikel: COMPUTERWOCHE.de

0

Auf dem Weg zur Langzeitarchivierung

Gastkommentar von Thomas Lutz, Unternehmenssprecher und Mitglied der Geschäftsleitung, Microsoft Österreich GmbH

Investitionsschutz
Wir arbeiten jeden Tag mit Kürzeln elektronischer Dateiformate. So sind zum Beispiel Milliarden von elektronischen Dokumenten im bekannten .doc-Standard von Microsoft abgespeichert. Nicht zuletzt die wahre Explosion des elektronischen Datenvolumens hat nun das Thema Langzeitarchivierung von Information wieder in den Mittelpunkt des öffentlichen Interesses gerückt. Neben den Aspekten von funktionsfähigen Abspielgeräten (können Sie heute noch eine 8“ Diskette verwenden?) und der Haltbarkeit von Speichermedien (CD/DVD-Halbwertszeit liegt bei zehn Jahren) spielen dabei auch offene Dokumentenformate eine wichtige Rolle. Diese zeichnen sich neben der Transparenz ihrer Struktur durch eine weitgehende Unabhängigkeit von Herstellern und damit verbundener Wahlfreiheit an Anwendungen aus.

Vom offenen zum ISO-Standard
Die Dokumentenformate, die aus der weltweit von über 500 Mio. Anwendern eingesetzten Microsoft Office-Suite stammen, sind bereits solche offenen Standards geworden. Microsoft hat diese bereits im Dezember 2006 an das seit 1960 bestehende internationale Standardisierungsgremium ECMA (European Computer Manufactures Association) übergeben. So können Word-, Excel- oder Powerpoint-Dokumente völlig unabhängig von Microsoft-Produkten erstellt und gespeichert werden.

Weltweit unterstützen bereits tausende unabhängige Softwarehersteller diesen offenen Standard. Auch Mitbewerber von Microsoft haben bereits hunderte von eigenen Programmen und Implementationen für Anwendungen geschrieben. Diese setzen den neuen internationalen Standard ein und erzeugen OpenXML-Dokumente (Endungen .docx, .xlsx, …), die vollständig kompatibel mit den Office-Programmen von Microsoft sind. Produkte wie zum Beispiel Apples iPhone unterstützen so die neuen OpenXML-Dokumentenformate. Der bereits von der ECMA verabschiedete offene Standard ist nun auf dem Weg zum ISO-Standard und genießt dabei weltweit breite Unterstützung: In Österreich zum Beispiel durch zahlreiche IT-Firmen, durch den Österreichischen Städtebund, oder durch die Österreichische Nationalbibliothek.

Offene Formate können deutlich mehr
Die neuen, offenen OpenXML-Formate können auch deutlich mehr als ihre Vorgänger. Auffälligster Punkt ist der weit geringere Platzbedarf; die neuen Dokumente benötigen bis zu 75 Prozent weniger Speicherplatz. Die neue XML-Struktur der Dokumente macht sie auch viel robuster und unanfälliger für Beschädigungen. Der größte Vorteil ist die vollständige Kompatibilität mit den bestehenden Dateiformaten älterer Office-Versionen. Damit ist der Investitionsschutz auch für bestehende Dokumente gesichert. Das große Ziel der Langzeitarchivierung von Wissen rückt so in greifbare Nähe.

Quelle und gesamter Artikel: medianet.at

0
Inhalt abgleichen

 


Sie können die Beiträge des Weblogs als RSS-Newsfeed beziehen. Drücken Sie einfach auf das nebenstehende Symbol oder kopieren Sie die dahinterliegende Adresse (URL) in Ihren RSS-Newsreader. Syndicate content
Syndicate content
Syndicate content