Glossar

a
Alephino

Alephino''Alephino'' ist eine schlanke Version der Bibliothekssoftware ALEPH 500 der ''Ex Libris Group'', die die Anforderungen kleinerer und mittlerer Bibliotheken adressiert. Der OPAC unterstützt die Suche in ''Google Books''; Daten können im RIS-Format für Literaturverwaltungsprogramme exportiert werden. ist eine schlanke Version der Bibliothekssoftware ALEPH 500 der Ex Libris Group, die die Anforderungen kleinerer und mittlerer Bibliotheken adressiert. Der OPACEin OPAC (kurz für Online Public Access Catalogue ist einen öffentlich (meist auch über das Internet) zugänglicher digitaler Bibliothekskatalog. Er ermöglicht die Volltextsuche, auch eingeschränkt auf Felder wie Autor und Titel, und ist oft mit einer Bestellfunktion versehen. unterstützt die Suche in Google Books; Daten können im RIS-Format für Literaturverwaltungsprogramme exportiert werden.

ALTO

ALTO (Analyzed Layout and Text Object) ist ein standardisiertes Speicherformat für Layoutinformationen, die aus OCROCR (Optical Character Recognition) ist die automatische Umwandlung von Bilddaten in Volltext. Da die rein optische Zeichenerkennung relativ fehlerträchtig ist, wird sie in der Regel durch verschiedene statistische und linguistische Verfahren zur Fehlerkorrektur ergänzt, z.B. ICR (Intelligent Character Recognition).-Software gewonnen werden. Das Format ist als Ergänzung zu METSMETS (Metadata Encoding & Transmission Standard) ist ein weit verbreitetes XML-Format zur Verknüpfung von Digitalisaten mit Metadaten. (Metadata Encoding and Transmission Standard) konzipiert, wobei METS MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. und Strukturinformationen bereithält, während die eigentlichen Inhalte in ALTO gespeichert werden.

Antiqua

Antiqua bezeichnet Schriftarten mit gerundeten Bögen und somit fast alle modernen Schriftarten. Antiqua-Schriften werden unter anderem in Serifen-Schriften (Times New Roman) und serifenlose bzw. Grotesk-Schriften (Arial, Helvetica) unterteilt.

Auflösung

Die Auflösung gibt bei digitalisierten Bildern die Anzahl von Bildpunkten (Pixel) – meist als relative Auflösung in Bezug auf eine Länge – an und ist ein Maß für den Detailreichtum der Images. Während im Internet Auflösungen ab 72 dpi (Dots per Inch – Bildpunkte pro Zoll) anzutreffen sind, fordert die DFG für die meisten Bilddigitalisate 300 dpi. So digitalisierte Bilder können auch in einem Buch gedruckt werden. Höhere Auflösungen – z.B. 600 dpi – werden beispielsweise bei Vorlagen mit feinen Strichen wie Kupferstichen oder Konstruktionsplänen angewendet.

Austauschformat

Als Austauschformat werden Datenformate zum Informationsaustausch zwischen unterschiedlichen Computern, Betriebssystemen und Anwendungsprogrammen bezeichnet. Sie zeichnen sich durch Langlebigkeit und Offenheit der Spezifikation aus.

b
Buchscanner

Ein Buchscanner wurde speziell zum Scannen von Büchern entwickelt. Bei der RetrodigitalisierungRetrodigitalisierung oder Retrospektive Digitalisierung ist die Digitalisierung analoger Medien, z.B. Bücher, Zeitschriften oder Tonträger. werden meist Auflichtscanner eingesetzt, das heißt, eine Scanzeile nimmt von oben das aufgeschlagene Buch auf, so dass nur umgeblättert und ggfs. eine Glasplatte zum Andrücken der Seiten auf- und zugeklappt werden muss. Buchscanner haben oft eine Buchwippe, um einbandschonend den Höhenunterschied zwischen rechter und linker Seite auszugleichen, oder eine spezielle Anlage, damit Bücher auch mit Öffnungswinkeln von weniger als 180° (einseitig) gescannt werden können.

c
COinS

COinS (ContextObjects in Spans) sind eine Methode (genauer: ein MikroformatMikroformate sind eine Möglichkeit, semantisch strukturierte Informationen in Webseiten (HTML oder XHTML) abzuspeichern. Damit können Suchmaschinen und andere Software diese Informationen leichter auswerten. Beispiele sind COinS und vCard.) zur Einbindung bibliographischer MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. in Webseiten.

Content Management System

Ein Content Managment System (CMS) ist eine Software zum Erfassen, Bearbeiten, Importieren, Verwalten und Publizieren unterschiedlicher Inhalte wie Texte, Bilder, Musik, Animationen und Videos. Es wird oft bei Verlagen, Institutionen oder größeren Webseiten eingesetzt, um hohe Datenmengen und komplizierte Abläufe beherrschen zu können. Aber auch bei kleineren Anwendungen können Open-Source-CMS sinnvoll sein, da sie viele Funktionen wie die dynamische Webseitenerstellung aus einer Datenbank und eine differenzierte Benutzerverwaltung bereits integriert haben.

d
DFG-Viewer

Mit dem DFG-Viewer können sehr einfach imageBei Digitalisierungsprojekten hat sich der Begriff Image für digitale Bilddaten eingebürgert. Das Dateiformat (z.B. TIFF, JPEG) ist dabei unerheblich.-digitalisierte Bücher online angezeigt werden. Voraussetzung ist eine METSMETS (Metadata Encoding & Transmission Standard) ist ein weit verbreitetes XML-Format zur Verknüpfung von Digitalisaten mit Metadaten.-Datei mit MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint..

Digital Object Identifier

Ein DOIEin DOI (Digital Object Identifier) ist ein persistenter Identifier für digitale Objekte wie Texte und Bilder. DOIs werden vielfach im Umfeld kommerzieller Online-Publikationen eingesetzt. (Digital Object Identifier) ist ein persistenter IdentifierJeder kennt das Problem: ein Weblink führt ins Leere oder auf eine zugriffsgeschützte Webseite. Ein persistenter Identifier ist im Unterschied zu einem Link eine Referenz auf ein digitales Objekt, vergleichbar einer ISBN. Über verschiedene technische Verfahren kann diese Referenz automatisch in eine aktuelle Webadresse umgewandelt werden. Es gibt verschiedene Systeme von persistenten Identifiern, etwa DOI, PURL oder URN. für digitale Objekte wie Texte und Bilder. DOIs werden vielfach im Umfeld kommerzieller Online-Publikationen eingesetzt.

Synonyme: DOI
DocBook

DocBookDocBook ist ein Standard für strukturierte Volltexte von Artikeln und Büchern. Es wird oft für technische Dokumentationen und Fachbücher eingesetzt. Für DocBook gibt es viele Werkzeuge, um Drucksachen und Webseiten zu erstellen. ist ein Standard für strukturierte Volltexte von Artikeln und Büchern. Es wird oft für technische Dokumentationen und Fachbücher eingesetzt. Für DocBook gibt es viele Werkzeuge, um Drucksachen und Webseiten zu erstellen.

Document Type Definition

Eine DTDEine DTD (Document Type Definition) ist eine Möglichkeit, die technische Struktur von XML-Dokumenten zu definieren. Zu vielen Standards wie DocBook oder EAC gibt es DTDs, allerdings werden DTDs zunehmend durch andere Definitionen ersetzt, wie z.B. XML Schema. (Document Type Definition) ist eine Möglichkeit, die technische Struktur von XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Dokumenten zu definieren. Zu vielen Standards wie DocBookDocBook ist ein Standard für strukturierte Volltexte von Artikeln und Büchern. Es wird oft für technische Dokumentationen und Fachbücher eingesetzt. Für DocBook gibt es viele Werkzeuge, um Drucksachen und Webseiten zu erstellen. oder EACEAC (Encoded Archival Context) ist ein XML-Format zur Beschreibung von Provenienz und Benutzungsgeschichte von Archivgut. gibt es DTDs, allerdings werden DTDs zunehmend durch andere Definitionen ersetzt, wie z.B. XML SchemaEin XML Schema ist eine Möglichkeit, die technische Struktur von XML-Dokumenten und den Inhalt einzelner Elemente zu definieren. Zu vielen Standards wie EAD oder MODS gibt es XML Schemata, da diese leistungsfähiger als DTDs sind..

Synonyme: DTD
Dublin Core

Dublin CoreDublin Core ist ein einfaches Set von Metadaten wie Autor, Titel und Sprache zur Beschreibung von Dokumenten. ist ein einfaches Set von MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. wie Autor, Titel und Sprache zur Beschreibung von Dokumenten.

Synonyme: DC
e
Einzugsscanner

Einzugscanner oder Dokumentenscanner scannen sehr schnell einzelne Seiten, meist im Stapelbetrieb. Um Bücher damit scannen zu können, müssen sie aufgeschnitten werden.

Encoded Archival Context

EACEAC (Encoded Archival Context) ist ein XML-Format zur Beschreibung von Provenienz und Benutzungsgeschichte von Archivgut. (Encoded Archival Context) ist ein XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Format zur Beschreibung von Provenienz und Benutzungsgeschichte von Archivgut.

Synonyme: EAC
Encoded Archival Description

EADEAD (Encoded Archival Description) ist ein standardisiertes XML-Format zur Beschreibung von archivarischen Findmitteln. Es ist international weit verbreitet und hat deshalb eine große Bedeutung für den Datenaustausch mit Webportalen und archivischen Suchmaschinen. (Encoded Archival Description) ist ein standardisiertes XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Format zur Beschreibung von archivarischen Findmitteln. Es ist international weit verbreitet und hat deshalb eine große Bedeutung für den Datenaustausch mit Webportalen und archivischen Suchmaschinen.

Synonyme: EAD
Encoded Archival Guide

EAGEAG (Encoded Archival Guide) ist ein XML-Format für Informationen über Archive wie Adressen, Öffnungszeiten oder technische Ausstattung. (Encoded Archival Guide) ist ein XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Format für Informationen über Archive wie Adressen, Öffnungszeiten oder technische Ausstattung.

Synonyme: EAG
EPUB

EPUB (kurz für electronic publication) ist ein XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-basiertes Format für E-Books. Es wird u.a. vom Sony E-Book-Reader unterstützt. E-Books nach dem EPUB Standard lassen sich besser als layout-orientierte PDFs auf unterschiedlichen Ausgabegeräten anzeigen. Auch die Dateigröße ist meist kleiner.

Exchangeable Image File Format

EXIFEXIF (Exchangeable Image File Format) ist ein Standard zur Ablage von Metadaten in Bilddateien (Images), z.B. bei den Formaten TIFF und JPEG. (Exchangeable ImageBei Digitalisierungsprojekten hat sich der Begriff Image für digitale Bilddaten eingebürgert. Das Dateiformat (z.B. TIFF, JPEG) ist dabei unerheblich. File Format) ist ein Standard zur Ablage von MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. in Bilddateien (Images), z.B. bei den Formaten TIFFTIFF (Tagged Image File Format) ist ein weit verbreitetes und sehr flexibles Dateiformat für Bilddaten. Bei Digitalisierungsprojekten wird es oft für unkomprimierte oder verlustfrei komprimierte Master-Dateien benutzt. und JPEGJPEG (Joint Photographic Experts Group) ist ein in der Regel verlustbehaftetes Komprimierungsverfahren und Dateiformat für Bilddaten..

Synonyme: EXIF
f
Farbprofil

Farbprofile sind gerätespezifische Übersetzungstabellen, um aus digitalen Bilddaten die tatsächlich darzustellende Farbe abzuleiten. Sie ermöglichen die genaue Wiedergabe von Farben auf unterschiedlichen Ausgabegeräten.

Fraktur

Mit FrakturMit Fraktur (besser Gebrochene Schrift) werden Schriftarten mit Knicken, Brüchen und Richtungswechseln in der Strichführung bezeichnet. In Fraktur sind sehr viele ältere deutsche Bücher gesetzt. (besser Gebrochene Schrift) werden Schriftarten mit Knicken, Brüchen und Richtungswechseln in der Strichführung bezeichnet. In Fraktur sind sehr viele ältere deutsche Bücher gesetzt.

g
GDPdU

Die GDPdU (Abkürzung für Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen) sind Regeln zur Aufbewahrung digitaler Unterlagen, besonders im Hinblick auf Steuern und Abgaben.

i
ICR

ICR (Intelligent Character Recognition) ist ein Verfahren zur Verbesserung der optische Zeichenerkennung (OCROCR (Optical Character Recognition) ist die automatische Umwandlung von Bilddaten in Volltext. Da die rein optische Zeichenerkennung relativ fehlerträchtig ist, wird sie in der Regel durch verschiedene statistische und linguistische Verfahren zur Fehlerkorrektur ergänzt, z.B. ICR (Intelligent Character Recognition)., Optical Character Recognition).

ID3

Mit ID3Mit ID3-Tags werden in MP3-Audio-Dateien Metadaten wie Autor, Titel und Sprache eingebunden.-Tags werden in MP3-Audio-Dateien MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. wie Autor, Titel und Sprache eingebunden.

Image

Bei Digitalisierungsprojekten hat sich der Begriff ImageBei Digitalisierungsprojekten hat sich der Begriff Image für digitale Bilddaten eingebürgert. Das Dateiformat (z.B. TIFF, JPEG) ist dabei unerheblich. für digitale Bilddaten eingebürgert. Das Dateiformat (z.B. TIFFTIFF (Tagged Image File Format) ist ein weit verbreitetes und sehr flexibles Dateiformat für Bilddaten. Bei Digitalisierungsprojekten wird es oft für unkomprimierte oder verlustfrei komprimierte Master-Dateien benutzt., JPEGJPEG (Joint Photographic Experts Group) ist ein in der Regel verlustbehaftetes Komprimierungsverfahren und Dateiformat für Bilddaten.) ist dabei unerheblich.

Imagedigitalisierung

Digitalisierung von Vorlagen als Bild, z.B. durch Scannen oder Digitalfotographie, im Unterschied zur VolltextdigitalisierungDigitalisierung von Textvorlagen als Text, z.B. durch OCR oder Abschreiben, im Unterschied zur Imagedigitalisierung..

IPAC

Ein IPAC (kurz für Image Public Access Catalogue) entsteht durch die ImagedigitalisierungDigitalisierung von Vorlagen als Bild, z.B. durch Scannen oder Digitalfotographie, im Unterschied zur Volltextdigitalisierung. eines klassischen Zettelkataloges. Oft wird ein Index, z.B. jeder 50. Karte, angelegt und eine Roh-OCROCR (Optical Character Recognition) ist die automatische Umwandlung von Bilddaten in Volltext. Da die rein optische Zeichenerkennung relativ fehlerträchtig ist, wird sie in der Regel durch verschiedene statistische und linguistische Verfahren zur Fehlerkorrektur ergänzt, z.B. ICR (Intelligent Character Recognition). für die Volltextsuche hinterlegt.

j
JPEG

JPEG (Joint Photographic Experts GroupJPEG (Joint Photographic Experts Group) ist ein in der Regel verlustbehaftetes Komprimierungsverfahren und Dateiformat für Bilddaten.) ist ein in der Regel verlustbehaftetes Komprimierungsverfahren und Dateiformat für Bilddaten.

Synonyme: Joint Photographic Experts Group
k
Kontrolliertes Vokabular

Ein kontrolliertes VokabularEin kontrolliertes Vokabular ist eine Sammlung von definierten Bezeichnungen zur Vermeidung von Mehrdeutigkeiten und Redundanzen. Kontrollierte Vokabulare spielen besonders bei der Erstellung von Schlagwortverzeichnissen und Indices sowie beim Austausch von Metadaten eine Rolle. Beispielsweise lässt sich ein Metadaten-Feld Sprache sowohl mit Begriffen wie »deutsch«, »Deutsch«, »deutsch (Deutschland)« belegen als auch durch eine definierte Bezeichnung z.B. nach ISO 639 »de«. ist eine Sammlung von definierten Bezeichnungen zur Vermeidung von Mehrdeutigkeiten und Redundanzen. Kontrollierte Vokabulare spielen besonders bei der Erstellung von Schlagwortverzeichnissen und Indices sowie beim Austausch von MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. eine Rolle. Beispielsweise lässt sich ein Metadaten-Feld Sprache sowohl mit Begriffen wie »deutsch«, »Deutsch«, »deutsch (Deutschland)« belegen als auch durch eine definierte Bezeichnung z.B. nach ISO 639 »de«.

m
Machine-Readable Catalog

MARC 21 (Machine-Readable CatalogMARC 21 (Machine-Readable Catalog) ist ein im englischen Sprachraum weit verbreitetes Austauschformat für bibliographische Daten.) ist ein im englischen Sprachraum weit verbreitetes AustauschformatAls Austauschformat werden Datenformate zum Informationsaustausch zwischen unterschiedlichen Computern, Betriebssystemen und Anwendungsprogrammen bezeichnet. Sie zeichnen sich durch Langlebigkeit und Offenheit der Spezifikation aus. für bibliographische Daten.

MARCXML

MARCXMLMARCXML ist ein bibliographisches Austauschformat und im wesentlichen eine Umsetzung der Felder von MARC 21 nach XML. ist ein bibliographisches AustauschformatAls Austauschformat werden Datenformate zum Informationsaustausch zwischen unterschiedlichen Computern, Betriebssystemen und Anwendungsprogrammen bezeichnet. Sie zeichnen sich durch Langlebigkeit und Offenheit der Spezifikation aus. und im wesentlichen eine Umsetzung der Felder von MARC 21 nach XML.

Maschinelles Austauschformat für Bibliotheken

MAB2 (Maschinelles Austauschformat für Bibliotheken) ist ein in Deutschland weit verbreitetes Austauschformat für bibliographische Daten.

Metadaten

Als MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (AuflösungDie Auflösung gibt bei digitalisierten Bildern die Anzahl von Bildpunkten (Pixel) – meist als relative Auflösung in Bezug auf eine Länge – an und ist ein Maß für den Detailreichtum der Images. Während im Internet Auflösungen ab 72 dpi (Dots per Inch – Bildpunkte pro Zoll) anzutreffen sind, fordert die DFG für die meisten Bilddigitalisate 300 dpi. So digitalisierte Bilder können auch in einem Buch gedruckt werden. Höhere Auflösungen – z.B. 600 dpi – werden beispielsweise bei Vorlagen mit feinen Strichen wie Kupferstichen oder Konstruktionsplänen angewendet., FarbprofilFarbprofile sind gerätespezifische Übersetzungstabellen, um aus digitalen Bilddaten die tatsächlich darzustellende Farbe abzuleiten. Sie ermöglichen die genaue Wiedergabe von Farben auf unterschiedlichen Ausgabegeräten.) gemeint.

METS

METS (Metadata Encoding & Transmission StandardMETS (Metadata Encoding & Transmission Standard) ist ein weit verbreitetes XML-Format zur Verknüpfung von Digitalisaten mit Metadaten.) ist ein weit verbreitetes XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Format zur Verknüpfung von Digitalisaten mit MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint..

Siehe auch: METSview Synonyme: Metadata Encoding & Transmission Standard
METSview

Mit METSviewMit METSview können sehr einfach image-digitalisierte Bücher online gestellt werden. Ein vorhandenes Inhaltsverzeichnis wird als Baumstruktur angezeigt und (meist kapitelweise) mit den dazugehörigen Images verlinkt. Voraussetzung ist eine METS-Datei mit Metadaten. können sehr einfach imageBei Digitalisierungsprojekten hat sich der Begriff Image für digitale Bilddaten eingebürgert. Das Dateiformat (z.B. TIFF, JPEG) ist dabei unerheblich.-digitalisierte Bücher online gestellt werden. Ein vorhandenes Inhaltsverzeichnis wird als Baumstruktur angezeigt und (meist kapitelweise) mit den dazugehörigen Images verlinkt. Voraussetzung ist eine METSMETS (Metadata Encoding & Transmission Standard) ist ein weit verbreitetes XML-Format zur Verknüpfung von Digitalisaten mit Metadaten.-Datei mit MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint..

Siehe auch: METS
MEX

MEX (Akronym für Midosa-Editor für XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Standards) ist ein freier Editor für EADEAD (Encoded Archival Description) ist ein standardisiertes XML-Format zur Beschreibung von archivarischen Findmitteln. Es ist international weit verbreitet und hat deshalb eine große Bedeutung für den Datenaustausch mit Webportalen und archivischen Suchmaschinen.-, EACEAC (Encoded Archival Context) ist ein XML-Format zur Beschreibung von Provenienz und Benutzungsgeschichte von Archivgut.- und METSMETS (Metadata Encoding & Transmission Standard) ist ein weit verbreitetes XML-Format zur Verknüpfung von Digitalisaten mit Metadaten.-basierte Findmittel und Aktensammlungen. Er ermöglicht die besonders einfache Erstellung von Online-Präsentationen.

MidosaXML

MidosaXML ist ein kostengünstiger Editor für gedruckte und Online-Findmittel. Er wurde von der Archivschule Marburg und der Startext GmbH entwickelt. MidosaXML unterstützt neben nativen XML- und Datenbankformaten auch EADEAD (Encoded Archival Description) ist ein standardisiertes XML-Format zur Beschreibung von archivarischen Findmitteln. Es ist international weit verbreitet und hat deshalb eine große Bedeutung für den Datenaustausch mit Webportalen und archivischen Suchmaschinen..

Mikroformat

Mikroformate sind eine Möglichkeit, semantisch strukturierte Informationen in Webseiten (HTML oder XHTML) abzuspeichern. Damit können Suchmaschinen und andere Software diese Informationen leichter auswerten. Beispiele sind COinSCOinS (ContextObjects in Spans) sind eine Methode (genauer: ein Mikroformat) zur Einbindung bibliographischer Metadaten in Webseiten. und vCard.

Mobipocket

Mobipocket ist ein Dateiformat für E-Books. Die Lesesoftware Mobipocket Reader gibt es für viele mobile Geräte wie Handys und Smartphones. Auch einige E-Book-Reader unterstützen dieses Format.

MODS

MODS (Metadata Object Description SchemaMODS (Metadata Object Description Schema) ist ein XML-Format für bibliografische Angaben.) ist ein XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Format für bibliografische Angaben.

Synonyme: Metadata Object Description Schema
MPEG-7

MPEG-7MPEG-7 ist ein XML-Standard für Metadaten zu Multimediadateien. ist ein XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Standard für MetadatenAls Metadaten oder Metainformationen werden allgemein Daten über andere Daten bezeichnet. Im Umfeld von Digitalisierungsprojekten sind damit meist Angaben über die Vorlagen (wie Autor, Titel, Erscheinungsjahr, Seitenzahl) oder die Digitalisate (Auflösung, Farbprofil) gemeint. zu Multimediadateien.

o
OCR

OCR (Optical Character Recognition) ist die automatische Umwandlung von Bilddaten in Volltext. Da die rein optische Zeichenerkennung relativ fehlerträchtig ist, wird sie in der Regel durch verschiedene statistische und linguistische Verfahren zur Fehlerkorrektur ergänzt, z.B. ICRICR (Intelligent Character Recognition) ist ein Verfahren zur Verbesserung der optische Zeichenerkennung (OCR, Optical Character Recognition). (Intelligent Character Recognition).

ONIX

ONIXONIX (Online Information eXchange) ist ein im Verlagsbereich verbreitetes Austauschformat für bibliographische Daten und Produktdaten. (Online Information eXchange) ist ein im Verlagsbereich verbreitetes AustauschformatAls Austauschformat werden Datenformate zum Informationsaustausch zwischen unterschiedlichen Computern, Betriebssystemen und Anwendungsprogrammen bezeichnet. Sie zeichnen sich durch Langlebigkeit und Offenheit der Spezifikation aus. für bibliographische Daten und Produktdaten.

OPAC

Ein OPAC (kurz für Online Public Access Catalogue ist einen öffentlich (meist auch über das Internet) zugänglicher digitaler Bibliothekskatalog. Er ermöglicht die Volltextsuche, auch eingeschränkt auf Felder wie Autor und Titel, und ist oft mit einer Bestellfunktion versehen.

p
Persistenter Identifier

Jeder kennt das Problem: ein Weblink führt ins Leere oder auf eine zugriffsgeschützte Webseite. Ein persistenter IdentifierJeder kennt das Problem: ein Weblink führt ins Leere oder auf eine zugriffsgeschützte Webseite. Ein persistenter Identifier ist im Unterschied zu einem Link eine Referenz auf ein digitales Objekt, vergleichbar einer ISBN. Über verschiedene technische Verfahren kann diese Referenz automatisch in eine aktuelle Webadresse umgewandelt werden. Es gibt verschiedene Systeme von persistenten Identifiern, etwa DOI, PURL oder URN. ist im Unterschied zu einem Link eine Referenz auf ein digitales Objekt, vergleichbar einer ISBN. Über verschiedene technische Verfahren kann diese Referenz automatisch in eine aktuelle Webadresse umgewandelt werden. Es gibt verschiedene Systeme von persistenten Identifiern, etwa DOIEin DOI (Digital Object Identifier) ist ein persistenter Identifier für digitale Objekte wie Texte und Bilder. DOIs werden vielfach im Umfeld kommerzieller Online-Publikationen eingesetzt., PURLEin PURL (Persistent Uniform Resource Locator) ist ein persistenter Identifier in Form einer normalen Webadresse. oder URNEin URN (Uniform Resource Name) ist ein persistenter Identifier. In Deutschland spielen URNs bei der Archivierung von Webpublikationen durch die Deutsche Nationalbibliothe eine Rolle. .

PURL

Ein PURLEin PURL (Persistent Uniform Resource Locator) ist ein persistenter Identifier in Form einer normalen Webadresse. (Persistent Uniform Resource Locator) ist ein persistenter IdentifierJeder kennt das Problem: ein Weblink führt ins Leere oder auf eine zugriffsgeschützte Webseite. Ein persistenter Identifier ist im Unterschied zu einem Link eine Referenz auf ein digitales Objekt, vergleichbar einer ISBN. Über verschiedene technische Verfahren kann diese Referenz automatisch in eine aktuelle Webadresse umgewandelt werden. Es gibt verschiedene Systeme von persistenten Identifiern, etwa DOI, PURL oder URN. in Form einer normalen Webadresse.

r
Relax NG

Relax NG (Regular Language Description for XML New GenerationRelax NG (Regular Language Description for XML New Generation) ist eine Möglichkeit, die technische Struktur von XML-Dokumenten und den Inhalt einzelner Elemente zu definieren. Zu manchen Standards wie DocBook oder TEI gibt es Relax NG Schemata.) ist eine Möglichkeit, die technische Struktur von XML-Dokumenten und den Inhalt einzelner Elemente zu definieren. Zu manchen Standards wie DocBookDocBook ist ein Standard für strukturierte Volltexte von Artikeln und Büchern. Es wird oft für technische Dokumentationen und Fachbücher eingesetzt. Für DocBook gibt es viele Werkzeuge, um Drucksachen und Webseiten zu erstellen. oder TEITEI (Text Encoding Initiative) ist ein sehr weit verbreitetes XML-Format für digitale Volltexte. Es zeichnet sich durch starke semantische Differenzierung, hohe Anpassungsfähigkeit an das konkrete Projekt und eine sehr gute Dokumentation aus. gibt es Relax NG Schemata.

Synonyme: Regular Language Description for XML New Generation
Repository

Mit RepositoryMit Repository wird im Umfeld von digitalen Bibliotheken ein Dokumentenserver zur Verwaltung, Veröffentlichung und Archivierung elektronischer Publikationen bezeichnet. wird im Umfeld von digitalen Bibliotheken ein Dokumentenserver zur Verwaltung, Veröffentlichung und Archivierung elektronischer Publikationen bezeichnet.

Retrodigitalisierung

Retrodigitalisierung oder Retrospektive DigitalisierungRetrodigitalisierung oder Retrospektive Digitalisierung ist die Digitalisierung analoger Medien, z.B. Bücher, Zeitschriften oder Tonträger. ist die Digitalisierung analoger Medien, z.B. Bücher, Zeitschriften oder Tonträger.

Synonyme: Retrospektive Digitalisierung
Retrokatalogisierung

Als RetrokatalogisierungAls Retrokatalogisierung bezeichnet man die Digitalisierung von Karteikarten bzw. Karteizetteln in Bibliotheken und Museen. bezeichnet man die Digitalisierung von Karteikarten bzw. Karteizetteln in Bibliotheken und Museen.

Retrokonversion

RetrokonversionRetrokonversion ist die Digitalisierung von Findmitteln in Archiven oder Bibliothekskatalogen. ist die Digitalisierung von Findmitteln in Archiven oder Bibliothekskatalogen.

s
SAFT

SAFT (Akronym für Standard-AustauschformatAls Austauschformat werden Datenformate zum Informationsaustausch zwischen unterschiedlichen Computern, Betriebssystemen und Anwendungsprogrammen bezeichnet. Sie zeichnen sich durch Langlebigkeit und Offenheit der Spezifikation aus. ) oder SAFT-XML ist – ähnlich wie EADEAD (Encoded Archival Description) ist ein standardisiertes XML-Format zur Beschreibung von archivarischen Findmitteln. Es ist international weit verbreitet und hat deshalb eine große Bedeutung für den Datenaustausch mit Webportalen und archivischen Suchmaschinen. – ein XML-Austauschformat für archivische Findmittel.


Schematron

SchematronSchematron ist eine regelbasierte Validierungssprache für XML-Dokumente. In Schematron werden XPath-basierte Regeln für die Gültigkeit definiert. Das ermöglicht, sowohl die Struktur als auch den Inhalt von Dokumenten zu prüfen, und zwar wesentlich detaillierter, als es andere Sprachen wie XML-Schema oder RelaxNG ermöglichen. Die Fehlerausgabe kann in natürlicher Sprache erfolgen. Schematron ist in XSLT implementiert, so dass zur Validierung nur ein XSLT-Prozessor notwendig ist. Deshalb ist Schematron auf vielen Plattformen verfügbar und einfach benutzbar. ist eine regelbasierte Validierungssprache für XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Dokumente. In Schematron werden XPath-basierte Regeln für die Gültigkeit definiert. Das ermöglicht, sowohl die Struktur als auch den Inhalt von Dokumenten zu prüfen, und zwar wesentlich detaillierter, als es andere Sprachen wie XML-Schema oder RelaxNG ermöglichen. Die Fehlerausgabe kann in natürlicher Sprache erfolgen. Schematron ist in XSLT implementiert, so dass zur Validierung nur ein XSLT-Prozessor notwendig ist. Deshalb ist Schematron auf vielen Plattformen verfügbar und einfach benutzbar.

SRU

SRU (Search/Retrieve via URLSRU (Search/Retrieve via URL) ist ein technischer Standard für bibliographische Anfragen an Online-Kataloge und andere Webanwendungen.) ist ein technischer Standard für bibliographische Anfragen an Online-Kataloge und andere Webanwendungen.

Synonyme: Search/Retrieve via URL
t
TEI

TEITEI (Text Encoding Initiative) ist ein sehr weit verbreitetes XML-Format für digitale Volltexte. Es zeichnet sich durch starke semantische Differenzierung, hohe Anpassungsfähigkeit an das konkrete Projekt und eine sehr gute Dokumentation aus. (Text Encoding Initiative) ist ein sehr weit verbreitetes XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Format für digitale Volltexte. Es zeichnet sich durch starke semantische Differenzierung, hohe Anpassungsfähigkeit an das konkrete Projekt und eine sehr gute Dokumentation aus.

Testchart

Ein TestchartEin Testchart ist eine Tafel mit genau definierten grauen und farbigen Flächen. Wird sie bei der Imagedigitalisierung mit aufgenommen, hat man im Digitalisat einen Anhaltspunkt für die Farbigkeit der Vorlage. An Hand genormter Testchart können Farbprofile errechnet werden. ist eine Tafel mit genau definierten grauen und farbigen Flächen. Wird sie bei der ImagedigitalisierungDigitalisierung von Vorlagen als Bild, z.B. durch Scannen oder Digitalfotographie, im Unterschied zur Volltextdigitalisierung. mit aufgenommen, hat man im Digitalisat einen Anhaltspunkt für die Farbigkeit der Vorlage. An Hand genormter Testchart können Farbprofile errechnet werden.

TIFF

TIFFTIFF (Tagged Image File Format) ist ein weit verbreitetes und sehr flexibles Dateiformat für Bilddaten. Bei Digitalisierungsprojekten wird es oft für unkomprimierte oder verlustfrei komprimierte Master-Dateien benutzt. (Tagged ImageBei Digitalisierungsprojekten hat sich der Begriff Image für digitale Bilddaten eingebürgert. Das Dateiformat (z.B. TIFF, JPEG) ist dabei unerheblich. File Format) ist ein weit verbreitetes und sehr flexibles Dateiformat für Bilddaten. Bei Digitalisierungsprojekten wird es oft für unkomprimierte oder verlustfrei komprimierte Master-Dateien benutzt.

u
unAPI

unAPIunAPI ist eine einfache Programmierschnittstelle zur Abfrage von Informationen aus Online-Katalogen und andere Webanwendungen. ist eine einfache Programmierschnittstelle zur Abfrage von Informationen aus Online-Katalogen und andere Webanwendungen.

URN

Ein URN (Uniform Resource NameEin URN (Uniform Resource Name) ist ein persistenter Identifier. In Deutschland spielen URNs bei der Archivierung von Webpublikationen durch die Deutsche Nationalbibliothe eine Rolle. ) ist ein persistenter IdentifierJeder kennt das Problem: ein Weblink führt ins Leere oder auf eine zugriffsgeschützte Webseite. Ein persistenter Identifier ist im Unterschied zu einem Link eine Referenz auf ein digitales Objekt, vergleichbar einer ISBN. Über verschiedene technische Verfahren kann diese Referenz automatisch in eine aktuelle Webadresse umgewandelt werden. Es gibt verschiedene Systeme von persistenten Identifiern, etwa DOI, PURL oder URN.. In Deutschland spielen URNs bei der Archivierung von Webpublikationen durch die Deutsche Nationalbibliothe eine Rolle.

Synonyme: Uniform Resource Name
v
Volltextdigitalisierung

Digitalisierung von Textvorlagen als Text, z.B. durch OCROCR (Optical Character Recognition) ist die automatische Umwandlung von Bilddaten in Volltext. Da die rein optische Zeichenerkennung relativ fehlerträchtig ist, wird sie in der Regel durch verschiedene statistische und linguistische Verfahren zur Fehlerkorrektur ergänzt, z.B. ICR (Intelligent Character Recognition). oder Abschreiben, im Unterschied zur ImagedigitalisierungDigitalisierung von Vorlagen als Bild, z.B. durch Scannen oder Digitalfotographie, im Unterschied zur Volltextdigitalisierung..

x
XML

XML (Extensible Markup LanguageXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.

Synonyme: Extensible Markup Language
XML Schema

Ein XML Schema ist eine Möglichkeit, die technische Struktur von XMLXML (Extensible Markup Language) ist ein Standard zur Strukturierung von Daten in lesbaren Textdateien.-Dokumenten und den Inhalt einzelner Elemente zu definieren. Zu vielen Standards wie EADEAD (Encoded Archival Description) ist ein standardisiertes XML-Format zur Beschreibung von archivarischen Findmitteln. Es ist international weit verbreitet und hat deshalb eine große Bedeutung für den Datenaustausch mit Webportalen und archivischen Suchmaschinen. oder MODSMODS (Metadata Object Description Schema) ist ein XML-Format für bibliografische Angaben. gibt es XML Schemata, da diese leistungsfähiger als DTDs sind.