Vorwort
In dieser Dokumentation des Metadatenschemas wird dargelegt, auf welche Art und Weise die TEI-P5-Richtlinien für die Klaus-Mollenhauer-Gesamtausgabe spezifiziert wurden. Konkret lässt sich daraus ablesen, wie die einzelnen Werke, ihre textlichen Bestandteile sowie die zugehörigen Metadaten, in XML erfasst werden.
TEI-Header
Im <teiHeader> werden die wichtigsten Metadaten erfasst. Der Aufbau des <teiHeader> ist immer gleich und besteht aus folgenden Bereichen:
fileDesc
In <fileDesc> werden die bibliographischen Angaben erfasst. Hierfür werden folgende Elemente verwendet:
titleStmt
Im <titleStmt> werden die Titelangaben des KMG-Texts erfasst. Es setzt sich aus folgenden Elementen zusammen:
Titel, Untertitel und alternativer Titel
Titel und Untertitel des KMG-Texts werden via <title> erfasst, dessen type mit main (Haupttitel) bzw. sub (Untertitel) spezifiziert wird.
Ein alternativer Titel (zum Beispiel ein anderer Titel in einer späteren Fassung) wird mittels type="alt" erfasst. Diese Angabe wird mit main/sub kombiniert.
Wenn ein Titel Satzzeichen enthält, werden diese auch aufgenommen. Für Anführungszeichen wird <q> verwendet siehe Anführungszeichen. Formatierungen werden nicht übernommen.
Autor
Der Autor bzw. die Autor*innen wird bzw. werden via <author> und <name> erfasst. Für die Spezifizierung von <name> siehe Auszeichnung von Personen, speziell die Auszeichnung von Personen im Header: Bei der ersten Erwähnung bekommt jede Person eine xml:id zugewiesen.
Bei mehreren Autor*innen werden mehrere <author> verwendet.
Weitere beteiligte Personen
Sollten weitere Personen an der Entstehung mindestens einer der verwendeten Fassungen beteiligt gewesen sein (z. B. Interviewer*innen, Moderator*innen, Interviewte oder Diskutant*innen), werden diese mittels <respStmt> erfasst, das <resp> und <name> enthält.
Via <resp> wird die Rolle erfasst. Folgende Werte sind möglich:
- Interviewer*in
- Mitarbeiter*in
- Moderator*in
- Interviewte*r
- Diskutant*in
- Vorwortschreiber*in
Die Person selbst wird mit <name> erfasst. Für die Spezifizierung von <name> siehe Auszeichnung von Personen, speziell die Auszeichnung von Personen im Header: Bei der ersten Erwähnung bekommt jede Person eine xml:id zugewiesen.
Jede beteiligte Person bekommt ein eigenes <respStmt>.
Bearbeiter*innen
Alle Personen, die an der Erstellung des jeweiligen KMG-Texts mitgewirkt haben (Korrekturlesen, XML-Datei auszeichnen, Kommentare verfassen usw.) haben den Status von Bearbeiter*innen. Sie werden via <editor> erfasst, das mit role spezifizert wird und <name> enthält.
Via role wird die Funktion des*der Bearbeiter*in erfasst. Erlaubt sind folgende Terme:
- Auszeichnung_Werkkommentar: Diese*r Bearbeiter*in hat die Auszeichnung des Werkkommentars vorgenommen.
- Kontrolllesung: Diese*r Bearbeiter*in hat an der Kontrolllesung dieses Werks mitgewirkt.
- editorische_Kommentierung: Diese*r Bearbeiter*in hat editorische Kommentare verfasst.
- Kollationierung: Diese*r Bearbeiter*in hat an der Kollationierung dieses Werks mitgewirkt.
- Werkkommentar: Diese*r Bearbeiter*in hat am Werkkommentar mitgewirkt.
- XML-Auszeichnung: Diese*r Bearbeiter*in hat die Auszeichnung im XML-Dokument vorgenommen.
Der*die Bearbeiter*in wird mit <name> und type="person" erfasst. Da alle Mitarbeiter*innen des Editionsprojekts im <seriesStmt> aufgeführt sind, werden die Bearbeiter*innen eines KMG-Texts mit ref auf den jeweiligen Eintrag im <seriesStmt> verwiesen. Der Wert von ref ist die im <seriesStmt> festgelegte xml:id.
Jede*r Bearbeiter*in bekommt ein eigenes <editor>.
editionStmt
Im <editionStmt> wird die Art der Edition erfasst. Dafür wird folgendes Element verwendet:
Dieser Bereich muss nicht angepasst werden.
publicationStmt
Im <publicationStmt> wird erfasst, von wem, wann, wo und zu welchen Bedingungen der KMG-Text publiziert wird. Es setzt sich aus folgenden Elementen zusammen:
Herausgebende Institution
Die Institution, die den KMG-Text herausgibt, wird via <publisher> und <name> erfasst. Da die SUB Göttingen die herausgebende Institution ist, wird mittels ref auf den entsprechenden Eintrag im <seriesStmt> verwiesen.
Dieses Element muss nicht angepasst werden.
Publikationsort
Der Publikationsort wird via <pubPlace> und <name> erfasst.
Dieses Element muss nicht angepasst werden.
Publikationsjahr
Das Publikationsjahr wird via <date> mit type="publication" erfasst. Mittels when wird das Publikationsjahr in maschinenlesbarer Form angegeben.
Lizenz
Die Lizenz, unter der der KMG-Text veröffentlicht wird, wird via <availability> und <licence> erfasst. In <licence> wird mit target die URL zur Lizenzdefinition angegeben.
Dieses Element muss nicht angepasst werden.
URI
Der URI der elektronischen Ressource wird via <idno> mit type="URI" erfasst.
KMG-Nummer
Die KMG-Nummer des Texts wird via <idno> mit type="KMG" erfasst.
Die KMG-Nummer der wissenschaftlichen Publikationen besteht aus drei Ziffern, zum Beispiel "012".
Die KMG-Nummer der Varia-Texte besteht aus einem V und zwei Ziffern, zum Beispiel "V03".
Die KMG-Nummer der Auszüge besteht aus einem A und zwei Ziffern, zum Beispiel "A06".
seriesStmt
Im <seriesStmt> werden die Informationen zur Gesamtedition erfasst. Dafür werden folgende Elemente verwendet:
Titel und Untertitel der Gesamtedition
Titel und Untertitel der Gesamtedition werden via <title> erfasst, das mittels type mit den Werten main (Haupttitel) bzw. sub (Untertitel) spezifiziert wird.
Herausgeber*innen
Die Herausgeber*innen der Gesamtedition werden via <editor>, <affiliation> und <name> erfasst. Für die Spezifizierung von <name> siehe Auszeichnung von Personen, speziell die Auszeichnung von Personen im Header: Bei der ersten Erwähnung bekommt jede Person eine xml:id zugewiesen.
Für jede*n Herausgeber*in wird die zugehörige Institution via <affiliation> mit corresp="#xml:id" erfasst.
Jede*r Herausgeber*in bekommt ein eigenes <editor>.
Diese Elemente müssen nicht angepasst werden.
Mitarbeiter*innen
Alle weiteren Mitarbeiter*innen an der Gesamtedition (die Bearbeiter*innen der jeweiligen KMG-Texte werden zusätzlich in Bearbeiter*innen aufgeführt) und ihre Rollen werden mittels <respStmt> erfasst, das <resp>, <affiliation> und <name> enthält.
Via <resp> wird die Rolle erfasst.
Der*die Mitarbeiter*in selbst wird mit <name> erfasst. Für die Spezifizierung von <name> siehe Auszeichnung von Personen, speziell die Auszeichnung von Personen im Header: Bei der ersten Erwähnung bekommt jede Person eine xml:id zugewiesen.
Für jede*n Mitarbeiter*in wird die zugehörige Institution via <affiliation> mit corresp="#xml:id" erfasst.
Jede*r Mitarbeiter*in bekommt ein eigenes <respStmt>.
Diese Elemente müssen nicht angepasst werden.
Beteiligte Institutionen
Die Institutionen werden via <respStmt> erfasst, das <resp> und <name> enthält.
Mit <resp> wird die Rolle der Institution erfasst.
Der Name der Institution wird mit <name> erfasst. Für die Spezifizierung von <name> siehe Auszeichnung von Institutionen, speziell die Auszeichnung von Institutionen im Header: Bei der ersten Erwähnung bekommt jede Institution eine xml:id zugewiesen.
Jede Institution bekommt ein eigenes <respStmt>.
Diese Elemente müssen nicht angepasst werden.
Geldgebende Institutionen
Geldgebende Institutionen werden genauso wie die anderen beteiligten Institutionen erfasst.
sourceDesc
Via <sourceDesc> werden die Informationen zu den Fassungen erfasst. Dabei werden via <listWit>, <witness>, <desc> und <bibl> alle Fassungen mit den bibliographischen Angaben der zugrundeliegenden Ausgaben aufgenommen.
<listWit> ist der Container für die verschiedenen Fassungen.
Jede Fassung bekommt ein eigenes <witness>, das mit xml:id spezifiziert wird. Mithilfe dieser ID können später in der Textkritik Veränderungen zwischen den Veröffentlichungen eines Texts erfasst werden.
Die Fassungen werden chronologisch mit Kleinbuchstaben ausgezeichnet (Sonderfall zusammengesetzte Monografien: Hier werden Großbuchstaben verwendet). Wenn eine Fassung aus mehreren Subfassungen besteht, bekommen alle Subfassungen den gleichen Buchstaben, werden aber zusätzlich durchnummeriert (a1, a2, a3...).
Auch wenn es nur eine Fassung gibt, wird eine xml:id vergeben.
Einige typographische Eigenschaften werden im <witness> mit rend erfasst:
- fraktur: Fassung ist in Fraktur gesetzt
- body_type: In der Fassung sind Hervorhebungen in der Grundschrift des Haupttextes (in der Regel nur bei Hervorhebungen in Hervorhebungen)
- bold: In der Fassung sind Hervorhebungen fett
- initial: In der Fassung sind Anfangswörter oder -buchstaben als Initialen hervorgehoben
- italics: In der Fassung sind Hervorhebungen kursiviert
- small_caps: In der Fassung sind die Hervorhebungen in Kapitälchen gesetzt
- spaced: In der Fassung sind Hervorhebungen gesperrt
- under: In der Fassung sind Hervorhebungen unterstrichen
- versal: In der Fassung sind Hervorhebungen in Versalien gesetzt
- end: In der Fassung sind Anmerkungen als Endnoten gesetzt
- foot: In der Fassung sind Anmerkungen als Fußnoten gesetzt
- qm_low: In der Fassung sind die vorderen Anführungszeichen unten
- qm_high: In der Fassung sind die vorderen Anführungszeichen oben
- g_out: In der Fassung werden Guillemets mit der Spitze nach außen verwendet
- g_in: In der Fassung werden Guillemets mit der Spitze nach innen verwendet
Die Sprache bzw. Rechtschreibung der Fassung wird im <witness> mit xml:lang erfasst. Folgende Werte sind erlaubt:
- de-1901: Deutsch nach alter Rechtschreibung
- de-1996: Deutsch nach neuer Rechtschreibung
- en: Englisch
- es: Spanisch
- fr: Französisch
- gsw: Elsässisch/Schweizerdeutsch
- la: Latein
- it: Italienisch
- ne: Niederländisch
- el: Griechisch
Gibt es mehrere Arten von Hervorhebungen, Anmerkungen oder Anführungszeichen in einer Fassung, werden die entsprechenden Kombinationen der genannten Werte verwendet.
Jede Fassung erhält ein <desc>, dass mit type="Fassung" spezifiziert wird. Darüber hinaus wird der Leittext mit type="Leittext" spezifiert.
Zudem werden im <desc> eine kurze Beschreibung der Fassung angegeben. Diese Beschreibung besteht immer aus dem Dokumententyp sowie der Jahresangabe. Folgende Bezeichnungen werden verwendet:
- Geleitwort
- Beitrag
- Monografie
- Gespräch
- Sonstige Texte
Die Jahreszahlen werden wie folgt erfasst:
- Wenn alle Ausgaben der Fassung im selben Jahr veröffentlicht wurden, wird diese Jahreszahl genannt
- Wenn die Fassung auf Ausgaben aus zwei Jahren basiert, werden diese beiden Jahreszahlen mit Komma getrennt erfasst
- Wenn die Fassung auf Ausgaben aus mehr als zwei Jahren basiert, werden die früheste und die späteste Jahresangabe mit Bindestrich verbunden erfasst
Jede Jahrezahl wird in einem <date> erfasst. Dieses <date> wird mit when spezifiziert (Jahreszahl).
Jede Fassung enthält ein <listWit>, in dem Angaben zu den zugrundeliegenden Ausgaben aufgenommen werden. Jede Ausgabe bekommt ein eigenes <witness>.
Jedes dieser <witness>-Elemente enthält ein <desc> und ein <bibl>.
Das <desc> wird mittels type als Ausgabe spezifiziert. Außerdem wird im type der Dokumententyp angegeben:
- article_journal: Aufsatz in einer fachwissenschaftlichen Zeitschrift
- article: Beitrag
- miscellaneous: Sonstige Texte
- monograph: Monografie
- preface: Geleitwort
- review: Rezension
- talk: Gespräch
In <bibl> wird die bibliographische Angabe mit einem Link zur Mollenhauer-Bibliographie erfasst. Siehe hierfür auch Literaturverweise.
Beispiel <sourceDesc> 1: Mehrere Ausgaben und mehrere Fassungen
Beispiel <sourceDesc> 2: Mehrere Ausgaben, nur eine Fassung
Beispiel <sourceDesc> 3: Nur eine Ausgabe
Beispiel <sourceDesc> 4: Zwei Fassungen in unterschiedlichen Formaten
encodingDesc
In <encodingDesc> wird das Editionsprojekt beschrieben und die Editionsrichtlinien erfasst.
Beschreibung des Editionsprojekts
Das Editionsprojekt wird in <projectDesc> beschrieben. Hierzu wird auf eine externe Datei verlinkt.
Dieser Bereich muss nicht angepasst werden.
Editionsrichtlinien
Die Editionsrichtlinien werden in <editorialDecl> wiedergegeben. Hierzu wird auf eine externe Datei verlinkt. Zudem wird ein einem weiteren <p> spezifiziert, welche Art des Kontrolllesens angewendet wurde.
Definitionen von Präfixen für externe Verweise
In <listPrefixDef> und <prefixDef> werden die Präfixe für Verweise auf externe Daten (zum Beispiel Normdatensätze) definiert.
Dieser Bereich muss nicht angepasst werden.
Einbindung des textkritischen Apparats
in <variantEncoding> wird mit method und location festgelegt, auf welche Art und Weise die Textkritik in den Text eingebunden wird.
Dieser Bereich muss nicht angepasst werden.
profileDesc
In <profileDesc> wird angegeben, welche Sprachen im KMG-Text und im Werkkommentar verwendet werden. Zudem wird der KMG-Text klassifiziert.
Sprachen
Für die Erfassung der Sprachen werden folgende Elemente verwendet:
In <langUsage> werden alle Sprachen gesammelt, die in den <text>-Elementen genutzt werden.
Die Sprachen werden in <language> mit ident spezifiziert:
- de-1901: Deutsch nach alter Rechtschreibung
- de-1996: Deutsch nach neuer Rechtschreibung
- en: Englisch
- es: Spanisch
- fr: Französisch
- gmh: Mittelhochdeutsch
- gsw: Elsässisch/Schweizerisch
- la: Latein
- it: Italienisch
- ne: Niederländisch
- el: Griechisch
Beispiel Sprachen
Textklassifikation und Stichworte
Für die Textklassifikation und die Erfassung von textspezifischen Stichworten werden die folgenden Elemente genutzt:
<textClass> ist das Container-Element für die <keywords>. Mittels corresp wird angegeben, dass der KMG-Text klassifiziert wird.
Textklassifikation
Für die Textklassifikation verlinkt das <keywords> via scheme auf ein Simple Knowledge Organization System (SKOS), das eine Ontologie zur Textklassifikation enthält. Das SKOS für die Klaus Mollenhauer Gesamtausgabe befindet sich hier: kmg_documenttype
<keywords> enthält die jeweiligen Klassifikationen. Hierfür wird <term> genutzt. Mittels key wird der passende Term aus dem SKOS spezifiziert. Dabei wird der jeweilige URI genutzt. Mittels xml:lang wird die Sprache des Terms angegeben. Der Term selbst wird als textlicher Inhalt von <term> aufgenommen.
Jedes TEI-Dokument wird mit zwei Termen klassifiziert: Einmal mit einer Kategorie des "Status" und einmal mit einer Kategorie der "Form".
- Wissenschaftliche Publikation (documenttype:554dc16e-2e64-452a-88f9-bfb4c2c368a3): Der Text muss folgende drei Kriterien erfüllen: der Text ist von KM (bzw. posthum) publiziert, er ist öffentlich verfügbar und er ist Teil von KMs wissenschaftlichem Werk.
- Ergänzendes Material (documenttype:8525963e-2a7d-4d34-be85-3893039d733e): Texte, die nicht die drei Kategorien für die Werke erfüllen
- Artikel (documenttype:943f9d06-3170-43b1-a00a-324b94379a04): Unselbständige wissenschaftliche Publikation
- Geleitwort (documenttype:7a69e938-1122-439a-b625-27d0fa77af1f): Geleitwort zu einem Sammelband oder einer Monografie
- Gespräch (documenttype:89d2c8ab-4a36-4ad1-b93c-44154f116631): Verschriftlichung einer Diskussion, Interviews oder eines Gesprächs
- Monografie (documenttype:da6784cb-a922-4ddf-aca1-dc96b24f07d4): Selbstständige wissenschaftliche Veröffentlichung
- Rezension (documenttype:e36f2134-ab2c-4d58-9ca7-565a295c5cf8): Rezensionen
- Sonstige Texte (documenttype:3d569917-5e2a-458d-8bbd-a1ded495e186): Sonstige Texte, zum Beispiel Erklärungen, Stellungnahmen
Stichworte
Pro Werk werden im Nachhinein Stichworte auf Basis der häufigsten fachspezifischen Substantive vergeben. Diese werden analog zur Textklassifikation in einem <keywords> aufgelistet. Diese <keywords> ist nicht durch Attribute spezifiziert.
Jedes Stichwort wird in einem <term> erfasst, dessen Sprache (xm:lang) spezifiziert wird.
Beispiel Textklassifikation und Stichworte
Non-TEI Metadata
In <xenoData> wird die TEI-Datei mit der PDF der Printfassung bzw. bei Nachlassdokumenten mit der PDF des Nachlassdokuments. Hierfür wird das Element <relatedResource> mit den Attributen type=pdf und uri (Verweis auf die permanente URL der PDF) verwendet. Eine Bezeichnung der verknüpften PDF wird als Klartext in <relatedResource> angegeben.
Beispiel Non-TEI Metadata
revisionDesc
In <revisionDesc> werden die Bearbeitungsschritte dokumentiert. Hierfür wird <change> verwendet.
<change> wird mit when="JJJJ-MM-TT" und who="#xml:id" spezifiziert. Im Textfeld werden die Änderungen kurz notiert. Bei bestimmten Meilensteinen wird zusätzlich ein status gesetzt:
- Basisauszeichnung: Basisauszeichnung abgeschlossen (Textstrukturen, Textmerkmale, Korrektur Texterkennung)
- Verweise: Verweise eingefügt (zotero- und GND-IDs)
- Zitate: Zitateprüfung abgeschlossen
- Validierung: Kommunikative Validierung abgeschlossen
- Stellenkommentare: Stellenkommentare eingefügt
- Werkkommentar: Editorischer Kommentar eingefügt
- Final: Finale Durchsicht abgeschlossen
Beispiel <teiHeader> eines KMG-Textes
Formale Erschließung
Auszeichnung von formalen Strukturen (Besonderheiten in Typographie und Layout).
Grundsätzliche Elemente der KMG-Edition
Die Inhalte eines KMG-Texts werden in <text> erfasst:
<text> wird mittels xml:id=KMG-Text als KMG-Text identifiziert. Zudem wird <text> mittels type=edition als Edition typisiert.
In <text> wird mit xml:lang angegeben, welche die Basissprache des Leittextes ist. Es sind folgende Terme erlaubt:
- de-1901: Basissprache ist Deutsch nach alter Rechtschreibung
- de-1996: Basissprache ist Deutsch nach neuer Rechtschreibung
- en: Basissprache ist Englisch
- es: Basissprache ist Spanisch
- fr: Basissprache ist Französisch
- gsw: Basissprache ist Schweizerdeutsch oder Elsässisch
- la: Basissprache ist Latein
NICHT Teil von <text> sind: Vorwort der Herausgeber*innen, editorische Richtlinien, Titel, Autor(*innen) sowie Inhaltsverzeichnis, Register und Anhänge der Edition. Diese Inhalte kommen in den Header oder werden automatisch erzeugt.
Beispiel KMG-Text
Informationsbereiche
Ein KMG-Text bestehen aus den drei grundlegenden Informationsbereichen <front>, <body> und <back>:
In <front> werden die Titelei und die Vorworte der Fassungen erfasst.
<body> umfasst den Hauptteil (von der Einleitung bis zum Fazit) des Originalwerks.
In <back> werden die Register und sonstige Anhänge der Fassungen aufgenommen.
Textabschnitte und -unterabschnitte werden mit <div> erfasst. Über type wird die Art und Ordnung des Textblocks spezifizert. Das in diesem Rahmen verwendete Vokabular setzt sich aus Termen des DFG Structural-Data-Set (im Folgenden: DFG-SDS) und eigenen Termen zusammen. Die möglichen Terme unterscheiden sich je nach Informationsbereich.
Textblöcke im Front-Bereich
Die Textblöcke im Informationsbereich <front> werden als <div> erfasst und durch type spezifiziert:
- cover: Das Cover (nur bei Monografien) (nicht im DFG-SDS enthalten).
- acknowledgment: Danksagung in den Fassungen (nicht im DFG-SDS enthalten)
- dedication: Widmung in den Fassungen.
- preface: Vorwort in den Fassungen.
- abstract: Abstract eines Aufsatzes oder Lead eines Zeitungsartikels (nicht im DFG-SDS enthalten)
- editorial: redaktionelle/editorische Hinweise (nicht im DFG-SDS enthalten)
Beispiel Textblöcke im Front-Bereich
Textblöcke im Body-Bereich
Die Textblöcke im Informationsbereich <body> werden als <div> erfasst und durch type spezifiziert:
- part: Ein Teil (mehrere Kapitel) eines Werks (nicht im DFG-SDS enthalten).
- chapter: Ein Kapitel ist Teil eines Teils.
- section: Ein Abschnitt ist Teil eines Kapitels oder Aufsatzes.
- literature: Literaturverzeichnis (nicht im DFG-SDS enthalten)
Hinweis: Es müssen nicht immer alle Arten von Textblöcken genutzt werden.
Unterteilungen von Abschnitten werden durch unspezifizierte <div> (d. h. ohne type) gebildet. Die Gliederung ergibt sich dann aus der Hierarchie im XML-Dokument.
Nicht immer sind Textblöcke durch Kapitelüberschriften o. Ä. gekennzeichnet. Auch ein größerer Abstand zwischen zwei Absätzen kann auf eine Unterteilung in zwei Textblöcke hinweisen.
Beispiel Struktur Monografie
Beispiel Struktur Aufsatz
Textblöcke im Back-Bereich
Die Textblöcke im Informationsbereich <back> (in der Regel Anhänge) werden als <div> erfasst und durch type spezifiziert:
- author_indication: Angaben zu dem/den Autor*innen (nicht im DFG-SDS enthalten).
- editorial: redaktionelle/editorische Hinweise (nicht im DFG-SDS enthalten)
- epilogue: Epilog (nicht im DFG-SDS enthalten)
- figures: Abbildungsverzeichnis (nicht im DFG-SDS enthalten)
- index: Das/die Register der Fassungen. In diesem Textblock muss <list> mit type="index" verwendet werden. Siehe hierfür Listenabsätze.
- literature: Literaturverzeichnis (nicht im DFG-SDS enthalten). Bei diesem type ist der subtype=bibliography erlaubt.
Darüber hinaus können auch die <div>-Typen des Body-Bereichs genutzt werden, sowohl um unspezifische Anhänge auf der gleichen Hierarchie-Ebene wie Index, Angaben zu den Autor*innen und dem Literaturverzeichnis zu erfassen als auch um die Textblöcke im Back-Bereich nochmal in Kapitel oder Abschnitte aufzuteilen.
Beispiel Textblöcke im Back-Bereich
Textabschnitte
Textabschnitte können in folgenden Elementen repräsentiert werden:
Die Elemente <p>, <list> und <table> sind die Grundelemente der Texte. Sie sind gleichwertig und bilden die kleinste Einheit. <table> darf in <p> und <list> stehen.
Überschriften
Überschriften werden via <head> repräsentiert. Die Hierarchie der Überschriften richtet sich nach der Hierarchie des jeweiligen <div>.
Die Originalnummerierung (ggf. inkl. "Kapitel" o. ä.) wird mittels <label> mit type="head" erfasst. Das Leerzeichen zwischen Nummerierung und Kapitelüberschrift wird weggelassen. Wenn im Original die Überschriften nicht nummeriert sind, wird dieses Element weggelassen.
Wenn Überschriften in einer Fassung immer auf die gleiche Art und Weise hervorgehoben sind (bspw. alle Kapitelüberschriften fettgedruckt, alle Abschnittsüberschriften kursiviert) wird an dieser Stelle kein <hi> verwendet. Nur wenn einzelne Überschriften oder Teile der Überschriften hervorgehoben sind, werden diese Textteile als Hervorhebungen ausgezeichnet.
Beispiel Überschrift
Überschriften von unselbstständigen Publikationen
Im Gegensatz zu den Titeln von Monografien, haben die Titel von unselbstständigen Publikationen (Aufsätze in Zeitschriften, Beiträge in Sammelbänden) gleichzeitig die Funktion von Überschriften. Sie werden deshalb mit <head> erfasst.
Sollte es eine Unterüberschrift geben, wird diese via <head> mit type="sub" erfasst.
Absätze
Normale Absätze werden via <p> erfasst. Ein "normaler Absatz" ist ein Textabschnitt, der aus einem oder mehreren Sätzen besteht und in der Regel eine Sinneinheit bildet. Absätze sind durch Zeilenumbrüche voneinander getrennt.
Beispiel Absätze
Absätze mit besonderer Formatierung
In einigen wenigen Fällen wird die Formatierung von Absätzen erfasst (in der Regel werden Hervorhebungen als Hervorhebungen erfasst). Dies betrifft erstens eingerückte Absätze und zweitens Absätze in kleinerer Schrift.
- indented: Eingerückt
- small_letters: kleinere Schrift
Auch Absätze, die Blockzitate enthalten, werden gegebenenfalls mit diesen Attributswerten ausgezeichnet.
Listenabsätze
Listenartige Strukturen, d. h. strukturierte hierarchisierende Auflistungen oder Aufzählungen von Elementen, werden via <list> erfasst. Einzelne Elemente einer Liste werden via <item> erfasst.
In <list> wird mittels type erfasst, ob die Liste durch Aufzählungszeichen, Nummerierung oder Schlagworte geordnet ist. Folgende Werte sind möglich
- gloss: Glossarartige Liste
- numbered: Nummeriert
- ordered: Aufzählungszeichen
- unspecified: ohne Aufzählungszeichen oder Nummerierung
- index: Registerliste (nur in <back> zu verwenden)
- abbildungstext: Textinhalt einer Abbildung (nur in <figure> zu verwenden)
Das Aufzählungszeichen (Spiegelstrich, Pfeil usw.), die Art der Nummerierung (römische/arabische Zahlen, Punkt oder Klammer usw.) oder bei glossarartigen Listen das Schlagwort werden in <label> erfasst. Das <label> wird mit type="list" spezifiziert. Wichtig: Leerzeichen nach dem Aufzählungszeichen werden nicht aufgenommen.
Wenn kein Aufzählungszeichen verwendet wird, wird kein <label> verwendet.
Hervorhebungen des Aufzählungszeichens (z. B. eine fettgedruckte Zahl) werden in der Regel nicht ausgezeichnet. Nur wenn die Hervorhebung unregelmäßig ist (wenn z. B. die "3" fettgedruckt, die anderen Zahlen aber normalgesetzt sind) wird die Hervorhebung ausgezeichnet.
Überschriften werden via <head> ausgezeichnet. Siehe hierzu "Erschließung von Überschriften".
Listenabsätze können auch innerhalb von Absätzen platziert werden.
In einigen wenigen Fällen wird die Formatierung von Listenabsätzen und den Einträgen erfasst (in der Regel werden Hervorhebungen als Hervorhebungen erfasst). Dies betrifft erstens eingerückte Listenabsätze und -einträge (stärker eingerückt als im jeweiligen Text üblich) und zweitens Listenabsätze und -einträge in kleinerer Schrift.
- indented: Eingerückt
- small_letters: kleinere Schrift
Auch Listeneinträge, die Blockzitate enthalten, werden gegebenenfalls mit diesen Attributswerten ausgezeichnet.
Beispiel Listenabsätze
Beispiel für nummerierte Listen
Beispiel Listen mit hervorgehobenen Anfangsworten
Unterlisten
Unterlisten werden als <list> in dem jeweligen <item>, dem sie untergeordnet sind, beschrieben.
Tabellen
Tabellen werden via <table> erschlossen und bestehen aus mehreren Zeilen (<row>), die sich aus mehreren Zellen (<cell>) zusammensetzen.
In <table> werden mit rows und cols die Anzahl der Zeilen und Spalten angegeben.
Tabellenüberschriften werden via <head> erschlossen. Siehe hierzu "Erschließung von Überschriften".
Hervorhebungen in Tabellen werden mit <hi> ausgezeichnet.
Bei Zeilenumbrüchen in einer Zelle, die nicht zufällig durch die Formatierung entstanden sind, wird ein Zeilenumbruch gesetzt.
In der Regel wird angenommen, dass eine <cell> auf allen vier Seiten umrandet ist. Sollten ein, mehrere oder alle Rahmen fehlen, wird dies mit rend erfasst:
- no_border_top: Kein Zellenrahmen oben
- no_border_right: Kein Zellenrahmen rechts
- no_border_bottom: Kein Zellenrahmen unten
- no_border_left: Kein Zellenrahmen links
- no_border: Kein Zellenrahmen
Wichtig: Es muss immer bei beiden anliegenden Zellen angegeben werden, dass eine Zellenbegrenzung fehlt.
Im Gegensatz zum bloß fehlenden Zellenrahmen kann in bestimmten Fällen auch davon ausgegangen werden, dass sich eine Tabellenzelle über mehrere Reihen bzw. Spalten erstreckt. Deshalb wird dann angegeben, über wie viele Spalten oder Zeilen sich die Zelle erstreckt. Dafür wird die Größe der Zelle mittels cols (Spalten) oder rows (Zeilen) spezifiziert. Dabei wird immer von links nach rechts bzw. oben nach unten gezählt. Bei Zellen die mehrere Spalten/Reihen überspannen, fehlen dementsprechend viele <cell> in der jeweiligen <row>.
Wenn alle Zellen einer Reihe keine Rahmen haben, wird die <row> mit rend="no_border" ausgezeichnet. Wenn alle Zellen einer Tabelle gar keine Rahmen haben, wird <table> mit rend="no_border" spezifiziert.
Leere Zellen werden als leere <cell> aufgenommen.
Eine Legende oder eine Erläuterung zur Tabelle wird via <trailer> mit type="table_legend" erfasst.
Tabellen können auch innerhalb von Absätzen platziert werden.
Beispiel Tabellen
Texteinteilungen
Die folgenden beiden Elemente <pb> und <lb> markieren den Beginn einer neuen Seite bzw. Zeile. Sie können in einem Textabschnitt (Absatz, Liste, Tabelle, Versgruppe) oder auch zwischen zwei Textabschnitten stehen. Wenn die Nummerierung sich auf Spalten bezieht (bspw. bei Lexikaeinträge), wird <cb> verwendet.
Seitenumbrüche
Seitenumbrüche werden via <pb> (Pagebeginning) erschlossen. Trennstriche bei Seitenumbrüchen werden gelöscht, es sei denn, die Schreibweise des Wortes hat sich geändert (siehe Erfassung und Korrektur der Silbentrennung.
In der Regel steht vor dem <pb> ein Leerzeichen. Nur wenn ein Wort durch den Seitenumbruch unterbrochen ist, stehen keine Leerzeichen vor oder nach dem <pb>. Wenn mit dem Ende der Seite auch der Absatz endet, steht ebenfalls kein Leerzeichen vor dem <pb> (auch nicht vor dem <p>-Endtag).
Es ist obligatorisch, mit n="SEITENZAHL", die Seitenzahl anzugeben, auf die umgebrochen wird. Dabei wird die Nummerierung im Original übernommen, d. h. lateinische und arabische Nummern werden dementsprechend erfasst. Mittels edRef wird angegeben, in welcher Fassung der Seitenumbruch vorkommt, siehe Varianz von Seitennummern. Dies wird auch angegeben, wenn es nur eine Textfassung gibt.
Wenn die Seite (abweichend vom Rest des Textes) im Querformat ist, dann wird dies im <pb> mittels rend="quer" erfasst.
Beispiel Seitenumbrüche
Seitenumbruch ohne Seitennummer
Wenn der Text bzw. einzelne Seiten keine expliziten Seitennummern aufweisen, werden die Seitennummern in eckige Klammern gesetzt. Dabei wird die Zählweise (arabisch oder lateinisch) des jeweiligen Abschnitts fortgeführt.
Absatzumbruch
In Ausnahmefällen kann ein Absatzumbruch nicht durch zwei Absatzelemente erfasst werden. Beispiele sind hierfür Absatzumbrüche in Zitaten, in Text zwischen Anführungszeichen, in einem Redebeitrag in einer Diskussionsrunde oder in einem Auszug aus einem Transkript eines Forschungsinterviews. In diesen Fällen wird der Absatzumbruch via <milestone> mit type="paragraph" erfasst. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
Wenn es sich nicht um den Beginn eines neuen Absatzes handelt, sondern lediglich um einen Zeilenumbruch, wird ein anderes Element verwendet.
Beispiel Absatzumbruch in einem Zitat
Spaltennummerierung
In einigen Texten werden nicht Seiten, sondern Spalten nummeriert (bspw. in Lexikaeinträgen). Die Spaltennummerierung wird via n in <cb> spezifiziert.
Der Seitenbeginn wird mit <pb> erfasst, in diesem Fall bekommt das <pb> aber kein n zugewiesen.
Beispiel Spaltennummerierung
Zeilenumbrüche
Nur in Ausnahmefällen werden Zeilenumbrüche erfasst, zum Beispiel wenn es innerhalb einer Überschrift oder in einer Tabellenzelle einen klar erkennbaren Zeilenumbruch gibt. Dabei geht es ausdrücklich nur um Zeilenumbrüche und nicht um Absatzumbrüche (diese werden im Normalfall als zwei Absätze oder in Ausnahmefällen als Absatzumbruch ausgezeichnet.
Mittels <lb> können Zeilenumbrüche ausgezeichnet werden.
Beispiel Zeilenumbruch in einer Überschrift
Anmerkungen
Anmerkungen (bspw. Fußnoten oder Endnoten) sind gekennzeichnet durch ein Referenzzeichen (Asterisk, Zahl, Buchstabe). Die Anmerkungen im Originalwerk werden mit <note> erfasst. Zudem werden <milestone> und <label> verwendet.
Die Position der Anmerkung (als Fußnote unter dem Text, als Endnote im Anhang) wird im <teiHeader> in der <sourceDesc> erfasst. Nur wenn es sowohl Fuß-, als auch Endnoten in einer Fassung gibt, wird <note> mit place spezifiziert.
- end: Endnote
- foot: Fußnote
Wenn unklar ist, von welcher Stelle auf die Anmerkung verwiesen wird (z. B. wenn im Text das Fußnotenzeichen fehlt), dann muss der*die jeweilige Bearbeiter*in entscheiden, wo das <note> am besten passen könnte. Zudem wird das <note> mit anchored="false" spezifiziert und der*die Bearbeiter*in mit resp angegeben.
Wenn Anmerkungen vorhanden sind, die klar erkennbar nicht von Mollenhauer gesetzt wurden (sondern z. B. durch den Herausgeber), dann werden diese Anmerkungen entsprechend gekennzeichnet. Hierfür wird das <note> mit type="editorial" spezifiziert.
Wenn eine Anmerkung in mehrere Absätze unterteilt ist, werden diese durch <milestone> mit type="paragraph" voneinander separiert, da <p> ausschließlich für Absatzstrukturen oberhalb der Anmerkungsebene genutzt wird.
Seitenzahlen in Anmerkungen
Die Seitenzahlen in Anmerkungen (Seitenzahlen von Endnoten sowie Seitenumbrüche) werden mit einem <milestone> erfasst, der mit unit="page" sowie type="endnotePageNumber" spezifiziert ist. Die Seitenzahl, auf der die Endnote steht bzw. auf die umgebrochen wird, wird im <milestone> mit n erfasst. Bei einem Seitenumbruch wird das <milestone> mit type="pagebreak" spezifiziert. Mittels edRef wird spezifiziert, auf welche Textfassung sich diese Seitenangabe bezieht (siehe Seitenumbrüche).
Nummerierung und besondere Zeichen
Die Anmerkungsnummer bzw. das Anmerkungszeichen wird mit <label> erfasst, das mit type="note_anchor" spezifiert ist. Der Inhalt von <label> ist die entsprechende Zahl oder das entsprechende Unicodezeichen. Ein abschließendes Leerzeichen wird nicht erfasst.
Wenn in der Fassung eine offenkundig fehlerhafte Nummerierung vorliegt (z. B. wenn auf Fußnote 11 die Fußnote 13 folgt), wird dieser Fehler genauso wie andere Schreibversehen mittels <choice>, <sic> und <corr> erfasst und korrigiert.
Wenn sich das Fußnotenzeichen im Text vom Fußnotenzeichen im Fußnotenapparat unterscheidet, wird nur das Fußnotenzeichen aus dem Apparat übernommen.
Beispiele Anmerkungen
Beispiel Fußnote
Beispiel Endnote
Beispiel Anmerkung mit mehreren Absätzen und editorischen Kommentaren
Beispiel nicht-autoriale Anmerkungen
Beispiel Seitenumbruch in Anmerkungen
Beispiel unklarer Verweis auf die Anmerkung
Beispiel nicht autoriale-Anmerkung ohne Fußnotenzeichen
Marginalien
Marginalien unterscheiden sich von Anmerkungen dadurch, dass sie nicht durch ein Referenzzeichen gekennzeichnet sind, sondern lediglich neben dem Text stehen. Sie werden via <seg> mit type="margin" erfasst.
Beispiel Marginalien
Versstrukturen
Versstrukturen (Gedichte, Lieder) werden via <lg> und <l> erfasst. Die einzelnen Verse werden als <l> ausgezeichnet. Eine Versgruppe (Strophe) wird über <lg> zusammengefasst.
Versstrukturen können innerhalb eines <p>, einer <cell> oder auch einem <div> auftreten.
In einigen wenigen Fällen wird die Formatierung von Versstrukturen erfasst (in der Regel werden Hervorhebungen als Hervorhebungen erfasst). Dies betrifft erstens eingerückte Absätze und zweitens Absätze in kleinerer Schrift.
- indented: Eingerückt
- small_letters: kleinere Schrift
Auch Versstrukturen, die Blockzitate enthalten, werden gegebenenfalls mit diesen Attributswerten ausgezeichnet.
Beispiel Versstrukturen
Brüche
Brüche werden zweimal via <formula> erfasst. Erstens via <formula> mit notation=tex. Dabei wird der Bruch in TeX-Formatierung als Text im <formula> aufgenommen. Darüber hinaus wird der Bruch im MathML-Format erfasst. Hierfür wird ein <formula> mit notation=mathml genutzt.
Beispiel Brüche
Geschützte Leerzeichen
In der späteren Verarbeitung der XML-Dateien (z. B. für die Darstellung im Webportal) unterliegen Leerzeichen verschiedenen Transformationen, bei denen in einigen Fällen Leerzeichen verschwinden. Um dies zu verhindern, kann statt eines normalen Leerzeichens (Leerzeichen-Taste) ein geschütztes Leerzeichen eingesetzt werden. Hierfür wird die entsprechende HMTL-Entität bzw. Numeric character reference in hex genutzt (in Worten: Und-Zeichen, Raute, kleines x, großes A, Null, Semikolon ohne Leerzeichen zwischen den Zeichen).
Nicht-textliche Bestandteile der KMG
Bilder und Grafiken
Bilder und Grafiken werden mit folgenden Elementen erfasst:
Für die Erfassung von Bildern und Grafiken wird <figure> als Containerelement verwendet. Das <figure> wird an der Stelle eingefügt, an der das Bild den Text unterbricht. Dies bedeutet, es wird auch mitten in Worte oder in Zitate eingefügt.
Wird die Grafik oder das Bild inzeilig verwendet, wird das <figure> mit rend=inline spezifiziert.
Das <figure> wird mit type spezifiziert. Folgende Werte sind möglich:
- art: Abbildung eines Kunstwerks
- child: Abbildung eines Bildes, das ein Kind angefertigt hat
- graphic: Abbildung eines Schaubilds, eines Diagramms oder einer Illustration
- impro: Abbildung einer Notation von Kindern improvisierter Musik
- music: Abbildung von Noten eines veröffentlichten Musikstücks
- photo: Abbildung einer Fotografie, die kein Kunstwerk ist
Via <graphic> wird mittels url auf den Scan des Bilds bzw. der Grafik verwiesen. Der Scan ist als Objekt in Textgrid angelegt. Es wird auf den TextGrid-URI der Bilddatei mittels url verwiesen. Mittels corresp wird auf die Lido-Daten verwiesen. Mittels mimeType wird das Format der Bilddatei angegeben. Mögliche Werte sind:
- image/jpeg: JPEG-Datei
- image/png: PNG-Datei
- image/tiff: Tiff-Datei
In <figDesc> wird ein Platzhaltertext erfasst, falls das Bild nicht angezeigt werden kann. Dieser Platzhaltertext ist eine kurze Beschreibung des sichtbaren Inhalts; bei Kunstwerken wird (zusätzlich) angegeben, dass es sich um eine Abbildung des Kunstwerks handelt. Da dieser Text keine Repräsentation eines Originaltexts von Mollenhauer ist, werden Entitäten nicht erfasst.
Es wird das weiter oben beschriebene Element <p> genutzt, um die Abbildungsbeschriftung aus der Publikation von Mollenhauer zu erfassen. Da dies eine Repräsentation des Originaltexts von Mollenhauer ist, kann in <p> mit <name> oder <rs> auf die LIDO-Daten verwiesen werden.
Wenn Grafiken oder Bilder Text enthalten, wird dieser via <list> und <item> erfasst. Das <list> wird dabei mit dem type="Abbildungstext" spezifiziert. Entitäten werden mit <name> oder <rs> erfasst.
Beispiel für Bilder
Beispiel Grafiken
Audioaufnahmen
Audioaufnahmen, die im Rahmen der KMG publiziert werden, werden mit folgenden Elementen erfasst:
Für die Erfassung von Audioaufnahmen wird <media> verwendet. Das <media> wird innerhalb eines <figure> oder in einem Textabschnitt (aber nicht in einem <list>) platziert.
Mittels mimeType=audio/wav wird definiert, dass eine Audio-Datei eingebunden wird.
Mittels url wird der TextGrid-URI der Audio-Datei angegeben.
Mit <desc> wird eine kurze, formale Beschreibung der Audioaufnahme erfasst. Mittels resp wird angegeben, wer für diese Anmerkung verantwortlich ist.
Beispiel Audioaufnahme
Inhaltliche Erschließung
Auszeichnung der Inhalte des Originalwerks, also Hervorhebungen, Verweise und Abkürzungen.
Hervorhebungen
Hervorhebungen im Originaltext werden mit <hi> ausgezeichnet:
Grundsätzlich ist die Art der Hervorhebung (kursiviert, unterstrichen, fett usw.) in der <sourceDesc> für den gesamten Text erfasst. Das heißt, wenn in einer Fassung nur eine Hervorhebungsart verwendet wurde, reicht es aus, die Hervorhebung durch ein unspezifiziertes <hi> auszuzeichnen.
Sollten unterschiedliche Arten der Hervorhebungen in einer Fassung verwendet werden, werden sie mittels rend erfasst. Zulässig sind folgende Werte:
- body_type: Grundschrift des Haupttextes (wird verwendet bei Hervorhebungen in Hervorhebungen)
- bold: fett
- initial: Initiale (Anfangswort oder -buchstabe)
- italics: kursiviert
- small_caps: Kapitälchen
- spaced: gesperrt
- text_border: umrandet
- under: unterstrichen
- versal: Versalien
Auch Kombinationen aus diesen Hervorhebungen sind möglich. Hierbei gibt es allerdings zwei Ausnahmen:
- spaced und body_type dürfen nicht mit anderen Hervorhebungen kombiniert werden
- body_type darf nicht in versal verwendet werden
Grundsätzlich werden alle Hervorhebungen mit <hi> erfasst, auch wenn z. B. alle Personennamen in einem Text kursiviert sind, werden diese mit <hi> getaggt. Eine Ausnahme sind aber die Aufzählungszeichen von Listenabsätzen sowie Überschriften, hier werden nur Unregelmäßigkeiten mit <hi> erfasst.
Hervorhebungen im Werkkommentar werden nicht weiter spezifiziert, sondern nur mit <hi> ausgezeichnet.
Beispiel Hervorhebungen I
Im folgenden Beispiel ist in der <sourceDesc> angegeben, dass Hervorhebungen kursiv sind.
Beispiel Hervorhebungen II
Im folgenden Beispiel ist in der <sourceDesc> angegeben, dass Hervorhebungen kursiv und fett sind.
Eingeschobene Textpassagen
Eingeschobene Textpassagen meint Absätze, die durch eine besondere Formatierung vom restlichen Text abgesetzt sind und die inhaltlich als Einschub fungieren. Das heißt, der Text A beginnt vor Text B und wird nach Text B fortgeführt. Dies lässt sich nicht via <div> lösen, da dann entweder Text A1, Text B und Text A2 gleichwertig wären oder Text A1 hierarchisch über Text B und Text A2 stehen würde.
Statt eines <div> wird <floatingText> mit type="insertion" genutzt.
Das <floatingText> enthält ein <body>, in dem wiederum alle anderen möglichen Textabschnitte und Textblöcke enthalten sein können.
Beispiel eingeschobene Textpassage
Anführungszeichen
Wenn eine Textpassage mittels Anführungszeichen oder Ähnlichem vom Rest des Textes abgesetzt ist, dann wird diese Passage via <q> erfasst. Dies betrifft auch Distanzierungen sowie in Anführungszeichen gesetzte Konzepte oder Termini, die zwar auf eine*n bestimmte*n Autor*in zurückzuführen sind, aber nicht auf eine bestimmte Textstelle. In solch einem Fall wird der Ursprung in einem editorischen Kommentar erläutert.
Anführungszeichen sind semantische Phänomene innerhalb von Strukturelementen, deshalb stehen sie immer innerhalb von <p>, <item> oder <cell>. Es ist auch erlaubt, ein <q> innerhalb von <lg> zu platzieren. Absatzumbrüche in ihnen werden deshalb mit <milestone> ausgezeichnet. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
<q> wird nicht bei klar erkennbaren Zitaten oder bei wörtlicher Rede verwendet.
In der sourceDesc wird erfasst, welche Arten von Anführungszeichen (deutsch, englisch, französisch usw.) in der Fassung verwendet werden. <q> wird diesbezüglich nur spezifiziert, wenn in der Fassung unterschiedliche Arten von Anführungszeichen verwendet werden. Es wird rend genutzt. Folgende Werte sind möglich:
- qm_low: vordere Anführungszeichen sind unten
- qm_high: vordere Anführungszeichen sind oben
- g_out: Guillemets, die nach außen zeigen
- g_in: Guillemets, die nach innen zeigen
Im Gegensatz zur Art der Anführungszeichen ist es zwingend erforderlich, mittels rend zu erfassen, ob es einfache oder doppelte Anführungszeichen sind. Zudem ist es möglich, zu spezifizieren, dass es keine öffnenden/schließenden Anführungszeichen gibt:
- single: einfache Anführungszeichen
- double: doppelte Anführungszeichen
- no_opening: keine "öffnenden" Anführungszeichen
- no_closing: keine "schließenden" Anführungszeichen
Beispiel Anführungszeichen
Ein Beispiel aus "Nachklänge zum Gautag":
Redeanteile in Diskussionsrunden und Interviews
Wörtliche Rede (z. B. in einer Diskussionsrunde oder einem Interview) wird mit <said> erfasst.
Redeanteile sind semantische Phänomene innerhalb von Strukturelementen, deshalb stehen sie immer innerhalb von <p>, <item> oder <cell>. Absatzumbrüche in ihnen werden deshalb mit <milestone> ausgezeichnet. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
Die Namen/Kürzel der sprechenden Personen werden mit <rs> oder <name> erfasst (siehe Auszeichnung von Personen).
Wenn im Text ersichtlich, wird im <said> mittels who erfasst, wer der*die Sprecher*in ist.
Es kann vorkommen, dass ein Redeanteil aus mehreren Absätzen besteht. In diesem Fall wird der Absatzumbruch via <milestone> mit type="paragraph" erfasst. Siehe hierfür den gleichen Fall bei Zitaten. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
<said> wird nur verwendet, wenn die Äußerungen auch tatsächlich einer Person zugeordnet werden können. Wenn dies nicht der Fall ist, siehe Anführungszeichen.
Sollten in einer Fassung immer ganze Redebeiträge hervorgehoben sein, werden die entsprechenden <said> mittels rend spezifiziert. Zulässig sind folgende Werte:
- bold: fett
- italics: kursiviert
- small_caps: Kapitälchen
- spaced: gesperrt
- under: unterstrichen
- versal: Versalien
Beispiel wörtliche Rede
Transkripte von Forschungsinterviews
Transkripte von wörtlicher Rede aus Forschungsinterviews werden mittels folgender Elemente erfasst:
Transkripte von wörtlicher Rede sind semantische Phänomene innerhalb von Strukturelementen, deshalb stehen sie immer innerhalb von <p>, <item> oder <cell>. Absatzumbrüche in ihnen werden deshalb mit <milestone> ausgezeichnet. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
Die sprechende Person wird immer mittels who in <u> erfasst. Das who verweist dabei auf die xml:id der Person.
Achtung! In der Regel wird <u> in Verbindung mit <rs> oder <name> verwendet. Diese Kombination kann nur in sehr wenigen Elementen genutzt werden, zum Beispiel in <quote> oder <q>, aber nicht in <p> oder <div>.
Pausen zwischen oder innherhalb von Sprechakten werden mittels <pause> erfasst.
Überlappende Sprechakte werden folgendermaßen erfasst: Mittels <anchor> werden Ankerpunkte in oder zwischen Sprechakten gesetzt. Es bietet sich an, den längsten Sprechakt als Grundlage zu nehmen; im Einzelfall kann aber auch ein anderes Verfahren sinnvoll sein. Diese Ankerpunkte werden mit xml:id spezifiziert. Die überlappenden (gleichzeitige) Sprechakte verweisen dann mit start und end auf diese Ankerpunkte.
Beispiel Transkript eines Forschungsinterviews mit überlappenden Sprechakten
Voran- oder nachgestellte Motti
Motti, Sinnsprüche oder Zitate, die einem Kapitel oder Werk vorangestellt sind, werden mit dem Element <epigraph> erfasst.
Das <epigraph> kann verschiedene Elemente enthalten: <p> für gewöhnliche Absätze, <l> und <lg> für Versstrukturen, <q> für Text in Anführungszeichen oder <cit> für Zitate. Wenn zwar ein Urheber, aber kein Literaturverweis angegeben ist, wird der Urheber in einem <bibl> erfasst. Sollte der vollständige Quellennachweis bekannt sein, kann ein normaler Literaturverweis gesetzt werden.
Beispiel voran- oder nachgestellte Motti
Zitate
Zitate sind durch Anführungszeichen und einen Literaturverweis (vorher oder nachher), der durch das Literaturverzeichnis eindeutig belegt werden kann (es kann sich also auch lediglich um einen Namen handeln, je nach Vorgabe der damaligen Redaktion), gekennzeichnet.
Fehlende Literaturverweise werden als editorische Literaturverweise ergänzt, falls sie ermittelt werden können.
Wenn es nicht klar ist, ob es sich um ein Zitat handelt oder es nur eine durch Anführungszeichen hervorgehobene Textstelle ist, wird diese mit <q> erfasst (siehe Anführungszeichen). Dies betrifft auch in Anführungszeichen gesetzte Konzepte oder Termini, die zwar auf eine*n bestimmte*n Autor*in zurückzuführen sind, aber nicht auf eine bestimmte Textstelle. In solch einem Fall wird der Ursprung in einem editorischen Kommentar erläutert.
Es werden folgende Elemente verwendet:
Zitierter Text und Literaturverweis
Um die Zusammengehörigkeit von zitiertem Text und Literaturverweis zu verdeutlichen, wird mit <cit> ein Container um <quote> und <bibl> gelegt.
Zitate sind semantische Phänomene innerhalb von Strukturelementen, deshalb stehen sie immer innerhalb von <p>, <item> oder <cell>. Es ist auch erlaubt, ein <cit> innerhalb von <lg> zu platzieren.
Zitierter Text
Der zitierte Text wird mit <quote> erfasst.
Zitate sind semantische Phänomene innerhalb von Strukturelementen, deshalb werden Absatzumbrüche in ihnen mit <milestone> ausgezeichnet. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
In der <sourceDesc> wird erfasst, welche Arten von Anführungszeichen (deutsch, englisch, französisch usw.) in der Fassung verwendet werden. <quote> wird diesbezüglich nur spezifiziert, wenn in der Fassung unterschiedliche Arten von Anführungszeichen verwendet werden. Es wird rend genutzt. Folgende Werte sind möglich:
- qm_low: vordere Anführungszeichen sind unten
- qm_high: vordere Anführungszeichen sind oben
- g_out: Guillemets, die nach außen zeigen
- g_in: Guillemets, die nach innen zeigen
Im Gegensatz zur Art der Anführungszeichen ist es zwingend erforderlich, mittels rend zu erfassen, ob einfache oder doppelte Anführungszeichen verwendet wurden. Es kann auch angegeben werden, dass keine Anführungszeichen bzw. keine "öffnenden" (vorne) oder "schließenden" (hinten) verwendet wurden.
- single: einfache Anführungszeichen
- double: doppelte Anführungszeichen
- none: keine Anführungszeichen
- no_opening: keine "öffnenden" Anführungszeichen
- no_closing: keine "schließenden" Anführungszeichen
Beispiel Zitate
Dieses Beispiel entspricht ganz bewusst nicht den Regeln zur Verwendung von <quote> ohne <cit>, um die Aufmerksamkeit auf das <quote> zu fokussieren.
Literaturverweise
Literaturverweise, bei denen alle Informationen im Text (im Gegensatz zum Werkkommentar, siehe auch Literaturverweise im Werkkommentar vorhanden sind (Korrekturen von Jahren, Verlagen, Seitenangaben können trotzdem vorgenommen werden, siehe auch KMG-Literaturverweise), werden mit folgenden Elementen erfasst:
Gewöhnlicherweise verweist das <bibl> mittels corresp auf einen Zotero-Eintrag (zotero:...). Bei Verweisen auf einen KMG-Text wird der Präfix kmglit: zusammen mit der KMG-Nummer und ggf. dem Fassungskürzel (z. B. a, b, sta, tia, A, B usw.) verwendet: kmglit:012-a verweist auf die Fassung a des KMG-Textes mit der KMG-Nummer 012.
Insbesondere bei Verweisen auf eine bestimmte Fassung eines KMG-Textes wird auch direkt auf die Repräsentation dieser Fassung im Webportal verwiesen (eventuell trifft das auch auf andere Literatur zu wie bspw. historische Gesetzestexte). Hierfür wird <ref> verwendet:
Mittels target wird die URL des der Online-Repräsentation des Textes angegeben. Es darf nur ein Wert in target eingegeben werden. Bei Verweisen auf eine Fassung eines KMG-Textes wird das Präfix textgrid: zusammen mit dem TextGrid-URI und dem Fassungskürzel (z. B. a, b, sta, A, B usw.) verwendet: textgrid:3qqtn-a verweist auf die Repräsentation der Fassung a des KMG-Textes mit dem TextGrid-URI 3qqtn im Webportal.
Die originale Literaturangabe (z. B. Name, Datum und Seitenangabe) aus der Fassung wird als Klartext im <bibl> angegeben. Dabei werden auch Hervorhebungen mit <hi> erfasst. Es werden aber keine Entitäten an dieser Stelle ausgezeichnet. Da innerhalb eines <cit> kein Plaintext stehen darf <bibl>, müssen Klammern und ähnliches wie z. B. vgl. auch Teil des <bibl> sein. Aus Gründen der Einheitlichkeit gilt diese Regel auch, selbst wenn das <bibl> kein Kindelement von <cit> ist (somit besteht auch die Möglichkeit, die <bibl> regelbasiert zu transformieren).
Wenn die originale Literaturangabe nicht vollständig ist, das heißt, nicht alle Informationen bietet, um den Titel zu finden, wird die Literaturangabe in einem KMG-Literaturverweis erfasst.
Wenn auf einen Textabschnitt (z. B. auf bestimmte Seiten) verwiesen wird, dann wird dieser in <citedRange> erfasst. Dabei wird <citedRange> mit unit, from und to spezifiziert. <citedRange> wird nicht genutzt, um die Gesamtseitenangabe eines Aufsatzes zu erfassen, dies wäre einfach Plaintext im <bibl>.
In from wird die erste Seite/Spalte/Paragraf/Kapitel erfasst, auf die verwiesen wird. In to die letzte Seite/Spalte/Paragraf/Kapitel. Wenn nur auf eine Seite/Spalte/Paragraf/Kapitel verwiesen wird, haben from und to die gleichen Werte. Bei "f." ist das to einen Wert höher als das from. Bei "ff." wird kein to angegeben. Bei "ebd." o. ä. enthält das <citedRange> keinen Inhalt, wird aber mit from und to spezifiziert.
Folgende Werte sind für unit möglich:
- absatz: Absatz
- chapter: Kapitel
- column: Spalte
- page: Seite
- paragraph: Paragraf (in Gesetzestexten)
- sheet: Blatt (z. B. bei Archivalien)
- vers: Vers
Wenn in einem Literaturverweis Anführungszeichen genutzt werden, werden diese mit <q> erfasst werden.
Wenn auf Periodika, also Zeitschriften, Zeitungen oder Magazine, und nicht auf einzelne Ausgaben dieser Periodika verwiesen wird, wird ein Verweis auf den GND-Datensatz gesetzt (siehe Erfassung von Periodika).
Beispiel Literaturverweis
Beispiel Literaturverweis mit Anführungszeichen
Beispiel Literaturverweis mit Verlinkung aufs Digitalisat
Beispiel Verweis auf einen KMG-Text
Verbindung von Literaturverweisen zu anderen Elementen (ohne Zitate)
Um die Verbindung zwischen einem Literaturverweis und einem anderen Element, bspw. einer Tabelle, herzustellen, wird dass corresp verwendet. Dabei wird auf den Literaturverweis verwiesen, dieser bekommt ein xml:id.
Beispiele Verbindungen von zitiertem Text und Literaturverweis
Beispiel Literaturverweis mit Zitat
Literaturverweise in Anmerkungen
Wenn der Literaturverweis in einer Anmerkung (<note>, siehe hierfür auch Anmerkungen) aufgeführt wird, wird <bibl> in <note> erfasst.
Unterbrochenes Zitat
Wenn ein Zitat von anderen Textpassagen unterbrochen wird, werden die <cit> mit next und prev miteinander verbunden. Die next und prev verweisen dabei auf die xml:id der einzelnen cit.
Beispiel unterbrochenes Zitat
Zitate die Textstrukturen überschneiden
Es kann vorkommen, dass Zitate Textstrukturen überschneiden, also zum Beispiel in einem Absatz beginnen, dann die nächsten Listenelemente umfassen, aber in einem Listenelement enden, welches noch weiteren Text (bspw. eine Literaturangabe) enthält.
In diesem Fall werden alle textlichen Inhalte der Textstrukturen wie bei den unterbrochenen Zitaten <cit> und <quote> ausgezeichnet. Beim ersten <quote> wird nicht nur die Art des Anführungszeichens im rend spezifiziert, sondern auch noch der Wert no_closing hinzugefügt. Beim letzten <quote> wird nicht nur die Art des Anführungszeichens im rend spezifiziert, sondern auch noch der Wert no_opening hinzugefügt.
Beispiel Zitate die Textstrukturen überschneiden
Einschübe in Zitaten
Bei Einschüben des Autors (Mollenhauer) in ein Zitat, wird der Einschub in einem <seg> mit type="quote_add" erfasst. Mittels resp wird kenntlich gemacht, wer für den Einschub verantwortlich ist (es wird auf dessen "xml:id" verwiesen). Wenn nicht ersichtlich ist, wer für den Einschub verantwortlich ist, wird der Einschub nicht gesondert erfasst.
Grammatikalische Anpassungen, die Mollenhauer vorgenommen hat, werden nicht gesondert ausgezeichnet. Wenn Mollenhauer grammatikalische Anpassungen vorgenommen, aber nicht gekennzeichnet hat, wird dies als Fehler ausgezeichnet.
Beispiel Einschübe in Zitaten
Erneutes Aufgreifen zitierter Passagen
Wenn Zitate oder Teile von Zitaten unverändert an späterer Stelle wieder aufgegriffen werden, das heißt, mit Anführungszeichen markiert aber ohne erneuten Literaturverweis nochmals zitiert werden, werden die beiden <quote> aufeinander bezogen. Hierfür bekommt das erste <quote> eine xml:id zugewiesen, worauf das zweite <quote> dann mittels corresp verweist. Nur in diesem Fall steht das <quote> außerhalb eines <cit>.
Wiederaufgegriffene Zitate sind semantische Phänomene innerhalb von Strukturelementen, deshalb stehen sie immer innerhalb von <p>, <item> oder <cell>. Es ist auch erlaubt, ein <quote> innerhalb von <lg> zu platzieren. Absatzumbrüche in ihnen werden deshalb mit <milestone> ausgezeichnet. Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
Beispiel erneute Zitation
Blockzitate
Blockzitate sind in der Regel längere Zitate, die als eigene Textblöcke vom restlichen Text abgesetzt sind. Sie werden als <quote> erfasst. Wenn das Blockzitat durch Einrückung gekennzeichnet ist, wird das <p>,<lg> oder <item>-Ancestorelement mit rend=indented spezifiziert. Wenn das Blockzitat durch eine Kursivierung vom Text abgesetzt wird, wird diese Kursivierung via <hi> mit rend="italics" ausgezeichnet.
Beispiel eingerücktes Zitat
Zitation von Versgruppen
Die Erfassung von zitierten Versgruppen kann komplex sein, da die Literaturverweise an verschiedenen Stellen platziert sein können.
Beispiel zitierte Versgruppe 1: ohne Quellenangabe
Beispiel zitierte Versgruppe 2: Quellenangabe im folgenden Absatz
Beispiel zitierte Versgruppe 3: Quellenangabe in eigener Zeile
Beispiel zitierte Versgruppe 4: Quellenangabe in der letzten Zeile der Versgruppe
Beispiel zitierte Versgruppe 4: Quellenangabe in einer Fußnote in der letzten Zeile der Versgruppe
Entitäten: Personen, Körperschaften, Kunst, Musik, Periodika und Markennamen
Entitäten, die in den edierten Texten namentlich genannt werden, werden mit <name> ausgezeichnet. Dabei wird nur der Name erfasst. In besonderen Fällen (z. B. die Sprecher*innen in Diskussionsrunden oder in Forschungsinterviews) werden Entitäten erfasst, selbst wenn nicht ihr Eigenname genannt wird. Dann wird <rs> verwendet. Personalpronomen werden nicht ausgezeichnet (siehe Ausnahmen weiter unten).
In beiden Fällen wird mit type spezifiziert, ob es sich um eine Person, einen Ort, eine Körperschaft, Kunst, Periodika oder Markennamen handelt:
- person: Personen
- org: Körperschaften
- art: Kunstwerke
- music: Musikstücke
- periodica: Periodika
- brand: Markennamen
Es gibt einige Ausnahmen von der Regel, dass Entitäten grundsätzlich immer ausgezeichnet werden:
- Pronomen werden nicht ausgezeichnet.
- In Literaturangaben (im <bibl>) werden Entitäten gar nicht ausgezeichnet.
In editorischen Kommentaren werden Entitäten ausgezeichnet.
Wenn nicht klar ist, auf welche Entitäten Bezug genommen wird, wird nicht mit <name> oder <rs> gearbeitet. Stattdessen wird in einem editorischen Kommentar erläutert, um wen/was es gehen könnte.
Personen
Personen werden via ref mit den Daten aus der GND verknüpft.
Fiktionale Personen (z. B. Charaktere in Romanen) werden zusätzlich zum type auch noch mit subtype="fictional" ausgezeichnet.
Beispiel Personen
Beispiel fiktionale Personen
Personennamen im Header
Bei Personennamen im <Header> werden immer Vor- und Nachname(n) mit <forename> und <surname> erfasst:
Beispiel Personen, die im Header und im Text vorkommen
Körperschaften
Körperschaften (Institutionen, Gruppen, Organisationen) werden via ref mit den Daten aus der GND verknüpft.
Beispiel Körperschaften
Kunst
Kunstwerke werden via ref mit einer LIDO-Datei in TextGrid verknüpft.
Beispiel Kunst
Musikstücke
Musikstücke werden via ref mit den Daten der GND verknüpft.
Zusätzlich werden mittels key einige Daten (Komponist*in, Titel, Jahr) nach folgendem Schema aufgenommen: "Nachname, Vorname: Titel (Jahr)".
Wenn möglich wird die Nennung des Musikstücks mit einer Verlinkung auf eine öffentlich zugängliche Aufnahme des Stücks ergänzt. Hierfür werden folgende Elemente verwendet:
Für die Verlinkung auf die Aufnahmen wird <ref> verwendet. Das <ref> wird innerhalb des <name> platziert.
Mittels type wird das <ref> mit recording spezifiziert.
Mittels target wird die URL angegeben.
Mit <desc> wird eine kurze, formale Beschreibung der Aufnahme erfasst. Mittels resp wird angegeben, wer für diese Anmerkung verantwortlich ist.
Beispiel Musik
Periodika
Periodika (Zeitschriften, Zeitungen, Magazine) werden via ref mit den Daten aus der GND verknüpft.
Beispiel Periodika (GND)
Markennamen
Markennamen (z. B. "Alete") werden via ref mit den Daten aus der GND verknüpft.
Beispiel Markennamen
Interne Verweise
Interne Verweise sind Verweise auf andere Kapitel oder Textstellen des gleichen Werks. Um diese Verweise zu repräsentiern, muss die Textstelle, auf die verwiesen wird, via xml:id mit einem eindeutigen Identifier ausgezeichnet werden. Der Verweis wird dann via <ref> mit target erfasst. Der Wert von target ist dann der Wert von xml:id mit einem vorangestellten "#". Es darf nur ein Wert in target eingegeben werden.
Beispiel interne Verweise
Verweise auf andere KMG-Texte
Es gibt drei verschiedene Möglichkeiten auf andere KMG-Texte zu verweisen:
- Verweis auf die TEI-Dokumente
- Verweis auf die Repräsentation einer bestimmten Fassung im Webportal
- Editorischer Literaturverweis
Verweis auf ein anderes TEI-Dokument
Um auf andere KMG-Texte zu verweisen, wird <ref> mit target genutzt. Der Wert von target ist der Textgrid-URI des Werks, auf das verwiesen wird. Es darf nur ein Wert in target eingegeben werden.
Um um auf einzelne Kapitel oder Textstellen in anderen Werken der KMG verweisen zu können, müssen diese Textstellen via xml:id mit einem eindeutigen Identifier ausgezeichnet werden. Der Wert der xml:id wird mit vorangestelltem "#" direkt hinter den Textgrid-URI des Werks gesetzt.
Beispiel Verweis auf Textstelle in einem anderen KMG-Text
Verweis auf die Repräsentation einer bestimmten Fassung im Webportal
Um auf die Repräsentation einer Fassung im Webportal zu verweisen wird wird <ref> mit target genutzt. Der Wert von target ist das Präfix textgrid: zusammen mit dem URI der TextGrid-Ressource und dem Fassungskürzel (z. B. a, b, sta, A, B usw.) verwendet: textgrid:3qqv4-a verweist auf die Repräsentation der Fassung a des KMG-Textes mit dem TextGrid-URI 3qqv4 im Webportal.
Um um auf einzelne Kapitel oder Textstellen in anderen Werken der KMG verweisen zu können, müssen diese Textstellen via xml:id mit einem eindeutigen Identifier ausgezeichnet werden. Der Wert der xml:id wird mit vorangestelltem "#" direkt hinter den Fassungskürzel gesetzt.
Beispiel Verweis auf eine Fassung im Webportal
Beispiel Verweis auf eine Textstelle in einer Fassung im Webportal
Editorischer Literaturverweis
Siehe Literaturverweise und Literaturverweise im Werkkommentar.
Abkürzungen
Grundsätzlich werden Abkürzungen nicht in den Dokumenten ausgezeichnet, sondern in einer gesonderten Textgrid-Ressource mit ihren Auflösungen erfasst. Die Liste ist Grundlage für das spätere Abkürzungsverzeichnis. Jede Abkürzung bekommt eine xml:id zugewiesen.
Textspezifische Abkürzungen
Textspezifische Abkürzungen (z. B. Abkürzungen von Lexikoneinträgen) werden an Ort und Stelle in den Dokumenten mit <choice>, <abbr> und <expan> aufgelöst.
Beispiel textspezifische Abkürzung
Mehrdeutige Abkürzungen
Auch Abkürzungen, deren Auflösung nicht der im Abkürzungsverzeichnis angegebenen entspricht (z. B. wenn im Abkürzungsverzeichnis "u.a." mit "unter anderem" aufgelöst wird, es im Text aber "und andere" meint), werden an Ort und Stelle im Dokument aufgelöst. Abkürzungen in Literaturverweisen werden grundsätzlich nicht aufgelöst.
Beispiel mehrdeutige Abkürzung
Andere Sprachen
Im KMG-Text wird erfasst, wenn einzelne Wörter, Phrasen oder Absätze in einer anderen Sprache als der Haupttext verfasst sind. Dafür wird das xml:lang genutzt. Wenn die entsprechende Textstelle sowieso schon mit einem Element markiert ist, kann dieses mit xml:lang spezifiziert werden. Ansonsten wird <foreign> genutzt.
Die erlaubten Werte für xml:lang sind:
- de-1901: Deutsch nach alter Rechtschreibung
- de-1996: Deutsch nach neuer Rechtschreibung
- en: Englisch
- es: Spanisch
- fr: Französisch
- gmh: Mittelhochdeutsch
- gsw: Elsässisch/Schweizerdeutsch
- la: Latein
- it: Italienisch
- nds: Niederdeutsch (im engeren Sinne), Plattdeutsch
- ne: Niederländisch
- el: Griechisch
- no: Norwegisch
- qnh: Neuhochdeutsch (local use)
- san: Sanskrit
In deutschen Texten gelten Wörter als fremdsprachig, wenn sie nicht im Duden aufgeführt werden.
In Literaturangaben werden fremdsprachige Wörter nicht als fremdsprachig ausgezeichnet.
Beispiel andere Sprachen
Editorische Einschübe
Im KMG-Text werden redaktionelle/editorische Einschübe erfasst. Hierfür wird das Element <seg> mit dem Attribut type=editorial genutzt.
Wenn bekannt ist, wer für den Einschub verantwortlich ist, wird dies mittels resp angegeben.
Beispiel editorische Einschübe
Textteile von nicht-Autor*innen
Textteile, die von anderen Personen als im <titleStmt> als <author> angegeben geschrieben wurden, werden mittels des Attributs resp erfasst. resp verweist dabei auf die xml:id eines <name>
Beispiel Textteile von nicht-Autor*innen
Kritische Kommentierung
Werkkommentar
Im Rahmen der KMG wird zu jedem Werk ein einführender Kommentar geschrieben.
Der Werkkommentar wird in einem gesonderten <text> mit type=commentary und xml:id=Werkkommentar erfasst. Dieses <text>-Element befindet sich zwischen dem <teiHeader> und dem <text>, in dem das Werk von Mollenhauer erfasst ist. Für die Auszeichnung des Werkkommentars gelten die gleichen Regeln wie für die Werke von Mollenhauer.
Hervorhebungen im Werkkommentar werden mit <hi> ausgezeichnet, aber nicht weiter spezifiziert.
Beispiel Werkkommentar
Literaturverweise im Werkkommentar
Wenn in einem Werkkommentar auf Literatur verwiesen wird, wird dafür <bibl> genutzt:
Im Gegensatz zu den Literaturverweisen im KMG-Text wird das <bibl> mit einem type=commentary spezifiziert.
Ansonsten gelten die gleichen Regeln wie bei den Literaturverweisen im KMG-Text.
Soll der Literaturverweis als Vollzitat im Text serialisiert werden, wird das <bibl> mittels rend=fullquote spezifiziert.
Beispiel Verweis auf einen KMG-Text innerhalb des Werkkommentars
Stellenkommentare
Kommentare zum Text, die im Rahmen der KMG geschrieben werden, werden via <note> mit type="commentary" erfasst. Siehe auch Anmerkungen. Der*die Verfasser*in des Kommentars wird mit resp erfasst. Als Wert werden die XML-IDs verwendet, die im Header eingeführt wurden.
KMG-Kommentare werden für folgende Zwecke gebraucht:
- Erläuterungen: Erklärungen und Hintergrundinformationen (bspw. zeitgenössisch-historische Phänomene)
- Querverweise zu anderen Werken/Nachlassdokumenten: Verlinkungen zu anderen Werken oder Nachlassdokumenten (auch solche Verlinkungen, die nicht von Mollenhauer selbst explizit gemacht wurden)
- Vermerk, dass eine Quelle nicht auffindbar oder rekonstruierbar war
Die formalen Strukturen werden in KMG-Kommentaren genauso erfasst wie in den Texten von Mollenhauer. Entitäten sowie Hervorhebungen, Anführungszeichen und Zitate werden wie im normalen Text erfasst.
Wenn auf Literatur verwiesen wird, um die Aussage des Kommentars zu belegen, wird das <bibl> mit einem type="commentary" spezifiziert.
Gesamtkommentare und editorische Literaturverweise sind streng genommen auch Teil der kritischen Kommentierung, werden aber anders erfasst.
Beispiel Stellenkommentare
Beispiel Literaturverweise in einem Stellenkommentar
Hinweise auf rassistische Sprache
Bei rassistischem Sprachgebrauch wird ein Kommentar gesetzt. Das <note> wird dann mit type=commentary und subtype=racism spezifiziert.
Beispiel Hinweis auf rassistische Sprache
KMG-Literaturverweise
Ein Ziel der KMG ist es, die Literaturverweise in Mollenhauers Werken zu überprüfen, zu präzisieren und zu ergänzen. Hierfür gibt es die KMG-Literaturverweise.
In der Art der Auszeichnung ähneln die KMG-Literaturverweise den Literaturverweisen von Mollenhauer: Das <bibl> wird aber mit type="KMG" spezifiziert. Der*die Verfasser*in des Literaturverweises wird mit resp erfasst. Als Wert werden die XML-IDs verwendet, die im <teiHeader> eingeführt wurden.
Das grundlegende Kriterium für die Verwendung von KMG-Literaturverweisen ist, dass die entsprechende Literaturangabe in der Originalpublikation so unvollständig ist, dass sich aus dieser allein nicht zweifelsfrei die Literatur identifizieren lässt. Wenn durch Recherechen zweifelsfrei festgestellt werden konnte, auf welchen Titel sich Mollenhauer bezogen hat, wird ein KMG-Literaturverweis in den Text eingefügt.
Wenn der entsprechende Titel nicht zweifelsfrei oder unvollständig (bspw. ohne die genaue Auflage) festgestellt werden konnte, aber es eine begründete Vermutung gibt, wird dies in einem editorischen Kommentar erläutert. Der Verweis auf die Zotero-Daten wird in diesem editorischen Kommentar platziert.
Auch wenn die Literaturangabe fehlt und nicht ermittelt werden konnte, wird dies in einem editorischen Kommentar vermerkt. Auch in diesem Fall wird das <bibl> mit type="KMG" spezifiziert.
Beispiel KMG-Literaturverweise
Editorische Eingriffe
Druckfehler und Schreibversehen
Für die Erfassung von Druckfehlern und Schreibversehen im Fließtext werden folgende Elemente verwendet:
<choice> ist dabei ein Container-Element, in dem sowohl der Originaltext als auch die Korrektur gesammelt werden. Das Original steht in einem <sic>, die Korrektur in einem <corr>. Das <corr> wird mit type="KMG" spezifiziert. Zudem wird mit resp angegeben, wer für die Korrektur verantwortlich ist.
Dieses Vorgehen wird u.a. bei folgenden Fällen angewendet:
- Rechtschreibfehlern
- Wortwiederholungen
- offensichtlich fehlenden Wörtern
- falschen Seitenangaben in Literaturverweisen
- fehlerhaften Zitaten (hierzu gehören nicht: Anpassungen von Interviewtranskripten für den Fließtext)
- doppelten oder fehlenden Satzzeichen
Achtung! Falls die Korrektur eine Einfügung ist (im Original fehlt zum Beispiel ein Leerzeichen), wird das <choice> um die beiden Wörter/Satzzeichen links und rechts von der Einführung gesetzt.
Achtung! Unter den fehlenden Satzzeichen bilden Anführungszeichen eine Ausnahme. Wenn von diesen eins fehlt (Anführungszeichen treten eigentlich immer nur zu zweit auf), wird das einzelne Anführungszeichen im <sic> als Unicodezeichen, aber die korrigierte Version im <corr> als <q> oder <quote> erfasst, siehe Beispiel 2. Wenn in diesem Fall der Text gleichbleibt, kann <seg> mit type="choice" unnd copyOf gearbeitet werden (ähnlich wie bei der Textkritik).
Fehlerhafte Formatierung: Zum Beispiel, wenn ein Absatz in kleinerer Schrift nach einem Seitenumbruch in normalgroßer Schrift erscheint.
Beispiel Druckfehler und Schreibversehen
Beispiel Ergänzung eines Satzzeichens
Beispiel fehlerhafte Anführungszeichen 1
Beispiel fehlerhafte Anführungszeichen 2
Beispiel fehlerhafte Nummerierung von Anmerkungen
Fehlerhafter Absatzumbruch
Wenn ein Absatzumbruch falsch gesetzt ist, muss dieser muss dieser in <sic> mit folgendem Element erfasst werden:
Der <milestone> wird mit type="paragraph".
Es ist möglich, die Formatierung des Absatzes, der durch den <milestone> eingeleitet wird, mit rend zu spezifizieren. Hierfür sind folgende Werte möglich:
- paragraph_normal: Der Absatz ist wie ein gewöhnlicher Absatz formatiert
In <corr> fehlt dann dieser <milestone>.
Bei unterschiedlichen Textfassungen wird das <milestone> mit edRef spezifiziert (siehe Seitenumbrüche).
Beispiel fehlerhafter Absatzumbruch
Erfassung und Korrektur der Silbentrennung
Wenn sich in den Fassungen die Worte aufgrund von Zeilenumbrüchen verändert haben (beispielsweise Bäk-ker statt Bäcker), dann wird dies stillschweigend korrigiert.
Auslassungen von Text
In einigen wenigen Fällen wird Text ausgelassen, zum Beispiel bei Redeanteilen, die nicht von Mollenhauer stammen. Die Auslassung wird mit einem <gap> markiert.
Im <gap> wird erfasst, wie groß die Auslassung ist. Dies geschicht mit unit und quantity. Für unit sind folgende Werte möglich:
- chars: Zeichen
- lines: Zeilen
- pages: Seiten
- paragraphs: Absätze
In quantity muss ein numerischer Wert eingetragen werden. Anderthalb wird als 1.5 eingetragen.
Das <gap> wird darüber hinaus mit folgenden Attributen spezifiziert:
- Mit reason="KMG" wird erfasst, dass es sich um eine Auslassung nach den editorischen Prinzipien handelt.
- Mit resp wird der*die verantwortliche Bearbeiter*in erfasst.
Beispiel Auslassungen
Inhaltsverzeichnisse
Um die Navigation im Webportal und in der Printfassung zu erleichtern, werden Inhaltsverzeichnisse erstellt. Diese können gegebenenfalls an die Inhaltsverzeichnisse der Originalpublikation angelehnt sein.
Das Inhaltsverzeichnis wird auf Grundlage ausgewählter Überschriften erzeugt. Hierfür werden eigene <head>-Elemente genutzt, die mit type="ToC" und xml:id spezifiziert sind. Der textliche Inhalt dieses <head> wird so angegeben, wie er auch im gedruckten Inhaltsverzeichnis erscheinen soll. In der Regel ist die Auszeichung genauso wie die Überschrift in der Originalpublikation (im Webportal werden aber nicht alle Auszeichnungen angezeigt). Dieses Element wird nicht im Text angezeigt.
Beispiel Inhaltsverzeichnis-Überschrift
Textkritik
Fassungsspezifische Varianten von Textstellen oder -strukturen werden im Rahmen der Textkritik erfasst. Die technische Einbindung des textkritischen Apparats wird im Header definiert, siehe Einbindung des textkritischen Apparats.
Für die Textkritik werden folgende Elemente verwendet:
<app> fungiert als Container für den Leittext und alle Varianten. Via <lem> wird der Leittext (die Erstveröffentlichung) erfasst, via <rdg> abweichende Varianten in späteren Fassungen.
Die <rdg> verweisen immer mittels wit auf die xml:ids aus der <sourceDesc> der jeweiligen Fassung (siehe sourceDesc). wit kann mehrere Werte enthalten, wenn die Textstelle in mehreren Fassungen gleich ist.
Die Veränderungen beziehen sich immer auf den Leittext. Wenn der Text in den Fassungen "a" und "c" identisch ist, aber "b" davon abweicht, wird der Text von "a" und "c" (via <lem> mit wit="#a #c") und "b" (via <rdg> mit wit="#b") in <app> erfasst.
<seg> wird genutzt, um textlich gleiche Passagen auszuzeichen, wenn kein passendes Container-Element vorhanden ist. Siehe hierfür das Zusammenführen und Auftrennen von Textstrukturen, das Beispiel bei der Varianz von Anmerkungen und das dritte Beispiel der kombinierten Text- und Strukturkritik.
<join> wird genutzt, um zusammengeführte Textstrukturen zu erfassen.
Ein Sonderfall ist die Varianz von Seitennummern.
Varianz von Textstellen
Wenn eine Textstelle (einzelne Zeichen, Wörter, Phrasen oder Sätze) in verschiedenen Fassungen unterschiedlich ist, wird in einem <app> die Textstelle der Erstauflage via <lem> und die Textstelle in den Varianten via <rdg> erfasst.
Wenn in späteren Fassungen eine Textstelle ausgelassen wurde, wird ein leeres <rdg> verwendet.
Wenn in späteren Fassungen eine Textstelle hinzugefügt wurde, hat nur das entsprechende <rdg> Inhalt.
Orthographische Fehler werden auch in der Textkritik mit <choice>, <sic> und <corr> erfasst, siehe Druckfehler und Schreibversehen.
Achtung: Wenn in einem <lem> oder <rdg> nur ein Leerzeichen stehen soll, muss anstelle von " " ein geschütztes Leerzeichen stehen.
Beispiel Varianz von Textstellen
Varianz von Textstrukturen
Varianz von Textstrukturen meint, dass sich Textstrukturen (siehe Textblöcke oder Textabschnitte) in verschiedenen Fassungen voneinander unterscheiden, also komplett umgeschrieben, hinzugefügt oder ergänzt wurden. Dabei ist zwischen zwei Fällen zu unterscheiden: Erstens, wenn nicht nur die Strukturen variieren, sondern auch der textliche Inhalt wesentlich verändert wurde. In diesem Fall werden analog zur Textkritik ganze Strukturelemente in <lem> und <rdg> erfasst. Zweitens, wenn der textliche Inhalt gleich oder zumindest weitestgehend gleich bleibt, aber sich die Strukturelemente verändern. In diesem Fall wird ein Verfahren angewendet, dass sich von der normalen Textkritik unterscheidet.
Große Abweichungen am Text
Wenn es zusätzlich zur Strukturvarianz große Veränderungen am Text gab, ist die Erfassung ganz ähnlich wie im vorherigen Kapitel. Der Unterschied ist, dass nicht einzelne Textstellen, sondern ganze Container (<div>, <p> usw.) in <lem> und <rdg> erfasst werden.
Wichtig ist, dass dabei das Content Model eingehalten wird. Zum Beispiel ist es nicht zulässig, dass innerhalb eines <div> nach einem <div> ein <p> folgt. Dies darf nicht durch die Textkritik ausgehebelt werden (siehe Beispiel 2).
Beispiel Varianz von Textstrukturen 1
Beispiel Varianz von Textstrukturen 2
Das <rdg> darf in diesem Fall ein <div> enthalten, da auf das <app> weitere <div> folgen. Wenn weitere <p> folgen würden, würde das <div> im <rdg> das Content Model von <div> verletzen.
Gleicher/ähnlicher Text in neuen Strukturelementen
Wenn sich die Strukturen verändern, der textliche Inhalt aber (weitestgehend) gleich bleibt, werden mittels xml:id Bezüge zwischen den Fassungen geschaffen. Dies hat den Vorteil, dass die Verbindungen zwischen den Textteilen der unterschiedlichen Fassungen sichtbar gemacht werden und dass eine redundante Texterschließung verringert wird.
Dabei sind zwei Punkte zu beachten: Das <rdg> wird mit type=varying-structure spezifiziert und der textliche Inhalt wird immer im <lem> erfasst.
Ersetzung eines Strukturelements durch ein anderes
Wenn das Strukturelement durch ein anderes ersetzt wird (bspw. das <p> in Fassung 1 zu einem <list> in Fassung 2), wird das Strukturelement im <lem> mit einer xml:id versehen. Das Strukturelement im <rdg> verweist mittels copyOf darauf.
Achtung! Mit copyOf wird nur angezeigt, dass der Inhalt (Text sowie Kindelemente) des einen Elements durch den Inhalt (Text sowie Kindelemente) ersetzt werden soll. Attribute und Attributswerte werden nicht übernommen. Das heißt, in dem Element, das mittels copyOf auf ein anderes Element verweist, müssen die Attribute ausgezeichnet werden.
Beispiel Ersetzung eines Strukturelements
Zusammenführung/Auftrennung von Strukturen
Wenn Textstrukturen zusammengeführt werden (bspw. zwei Absätze in Fassung 1 zu einem Absatz in Fassung 2), werden die mit xml:id markierten Strukturelemente in einem <join> zusammengeführt.
Das <join> wird mit drei Attributen spezifiziert:
- Mit result wird angegeben, was das zusammengeführte Element für ein Element ist. Der Wert des Attributs ist gleich dem Namen des Elements.
- In target werden die xml:id der zusammengeführten Elemente in der Reihenfolge aufgeführt, in der sie zusammengeführt werden.
- Mittels scope wird spezifiziert, auf welche Weise die Elemente zusammengeführt werden:
- root: <join> erzeugt ein neues Strukturelement (z.B. <div>, der Elementname wird in result angegeben). Die Elemente, auf die mittels targetverwiesen wird, werden zu Kindelementen dieses neuen Strukturelements. Anwendungsfall: Absätze sind in Fassung b in einer anderen Reihenfolge als in Fassung a.
- branches: <join> erzeugt ein neues Element (der Elementname wird in result angegeben). Von den Elementen, auf die mittels targetverwiesen wird, wird der Inhalt (Text und Kindelemente) übernommen. Anwendungsfall: In Fassung a befinden sich mehrere Absätze, deren Inhalt in Fassung b in einem Absatz ist.
Darüber hinaus können noch weitere Attribute wie rend oder type verwendet werden, um das result-Element zu spezifizieren.
Achtung! Bei der Verwendung von <join> muss darauf geachtet werden, dass das Content Model des Parent-Element eingehalten wird. Zum Beispiel darf in einem <div> auf ein <div> kein <p> folgen. Also darf nach einem <div> kein <join> verwendet werden, das mit result=p spezifiziert ist.
Bei Auftrennungen (bspw. ein Absatz in Fassung 1 wird zu zwei Absätzen in Fassung 2) werden im <lem> die einzelnen Abschnitte mit <seg>type=copy erfasst. In <rdg> wird auf mittels copyOf auf die xml:ids der <seg> verwiesen.
Beispiel Neuordnung von Elementen in einem Element
Beispiel Zusammenführung von Elementen zu einem Element
Beispiel Auftrennung einer Überschrift in mehrere Überschriften
Kombination von Text- und Strukturvarianzen
Selbst wenn sowohl die Strukturen als auch der textliche Inhalt von einer Fassung zum anderen verändert wurden, kann es unter Umständen sinnvoll sein, mit copyOf bzw. <join> zu arbeiten, also nicht, wie oben beschrieben. Dies ist der Fall, wenn die Veränderungen des textlichen Inhalts nur geringfügig sind oder wenn es mehr als zwei Fassungen gibt und Kontinuitäten und Varianzen des textlichen Inhalts über die Strukturveränderungen hinweg abgebildet werden sollen.
Verfahren wird nach einer verschachtelten Textkritik, bei der <app> in <lem>/<rdg> genutzt werden. Dabei werden die Strukturveränderungen wie oben beschrieben erfasst. Innerhalb des Textes werden dann die textlichen Varianzen wie bei der normalen Textkritik erfasst.
Beispiel Kombination von Text- und Strukturvarianzen
Beispiel Kombination von Text- und Strukturvarianzen 2: Versgruppen
Beispiel Kombination von Text- und Strukturvarianzen 3: Kursivierung von Fußnoten
Sonderfälle der Textkritik
Varianz in Listenabsätzen
Da die Textkritik bei Listenabsätzen komplex werden kann, gibt es an dieser Stelle drei Beispiele:
Beispiel Varianz von Liste 1: Liste in der Textstrukturkritik
Beispiel Varianz Liste 2: Item in der Textstrukturkritik
Beispiel Varianz Liste 3: Item in der Textstrukturkritik 2
Varianz von Tabellen
Sollten Tabellen in verschiedenen Auflagen unterschiedlich viele Spalten oder Zeilen haben, werden die Tabellen jeweils komplett in <lem> und <rdg> erfasst. Die Bereiche, die inhaltsgleich sind, werden mit copyOf erfasst.
Wenn lediglich der Inhalt einzelner Zellen unterschiedlich ist, werden diese Varianten wie oben erklärt erfasst.
Beispiel Varianz von Tabellen
Varianz bei Anmerkungen
Wenn die Anmerkungen in unterschiedlichen Fassungen eine unterschiedliche Nummerierung/Kennzeichnung haben, werden die <label> in <lem> und <rdg> erfasst.
Textlich gleiche Bereiche werden mit xml:id und copyOf erfasst.
Die Strukturveränderungen, bei denen <note> durch ein anderes Element ersetzt wird oder selbst ein anderes Element ersetzt, müssen mit einem <seg> mit type="copy" erfasst werden. Andernfalls kann das <label> nicht von der Varianz ausgenommen werden.
Beispiel Varianz von Anmerkungen
Varianz von Literaturverweisen
Grundsätzlich muss in der Varianz von Literaturverweisen zwischen zwei Fällen unterschieden werden:
- Die Literatur, auf die verwiesen wird, bleibt in verschiedenen Fassungen gleich, aber die Literaturverweise unterscheiden sich durch die Art des Zitationsstils.
- Die Literatur, auf die verwiesen wird, ist in verschiedenen Fassungen unterschiedlich, d.h. es wird ein Literaturverweis ersetzt, weggelassen oder hinzugefügt.
Beispiel Varianz Literaturverweise I
Im folgenden Beispiel verweisen alle Fassungen auf die gleiche Literatur, verwenden jedoch unterschiedliche Zitationsstile und in Fassung "b" befindet sich ein Tippfehler. Das heißt, dass corresp in <bibl> bleibt gleich, aber der Inhalt ändert sich (d.h. der sich ändernde Literaturverweis wird wie eine beliebige andere veränderte Zeichenfolge behandelt).
Beispiel Varianz Literaturverweise II
Im folgenden Beispiel verweist die Fassung "a" auf Literatur 1, "b" auf Literatur 1 und 2 und "c" nur auf Literatur 2.
Beispiel Varianz Literaturverweise III
Im folgenden Beispiel sind beide Fälle kombiniert: Der erste Literaturverweis ist in den Fassungen a-c vorhanden, wird aber durch einen anderen Zitationsstil und die Korrektur eines Tippfehlers verändert. Der zweite Literaturverweis kommt nur in den Fassungen c und d vor, verändert sich aber nicht. Da auf so vielen Ebenen Varianten vorkommen, ist es nicht sinnvoll, mit copyOf zu arbeiten.
Im Gegensatz zum Beispiel Varianz Literaturverweise I muss zusätzlich noch ein weiteres <app> eingefügt werden, um die Veränderung des Abschlusses der ersten Literaturangabe (von "." zu "; ") zu erfassen (man beachte das Leerzeichen!).
Beispiel Varianz Literaturverweise IV
Im folgenden Beispiel gibt es drei Fassungen, die unterschiedliche Zitationsstile haben. Fassung a und b zitieren in Fußnoten (aber in unterschiedlichen Stilen), wohingegen Fassung c in Klammern im Text Literaturverweise setzt. Da aber in allen drei Fassungen auf die gleiche Literatur verwiesen wird, soll das <bibl> das gleiche sein. Deshalb wird in einem ersten <app> zwischen <note> (Fassungen a+b) und nicht-<note> (Fassung c) unterschieden. Das <rdg> mit wit="#c" verweist dabei auf das <bibl> im <lem>. Dieses <bibl> enthält wiederum sehr feinteilig ausgezeichnet den textlichen Inhalt von allen drei Zitationsstilen.
Varianz von Hervorhebungen
Auch die Varianz von Hervorhebungen wird via <app>, <lem> und <rdg> erfasst. Dabei gelten die Regeln für die Auszeichnung von Hervorhebungen: Wenn in einer Fassung nur eine Hervorhebungsart verwendet wird, müssen die einzelnen <hi> nicht spezifiziert werden. Sobald in einer Fassung mehr als eine Hervorhebungsart verwendet wird, ist es notwendig, das jeweilige <hi> mittels rend zu spezifizieren.
Beispiel Varianz von Hervorhebungen I
Im folgenden Beispiel wird in jeder Fassung jeweils eine Hervorhebungsart verwendet.
Beispiel Varianz von Hervorhebungen II
Im folgenden Beispiel wurden in Fassungen a und b nur jeweils eine Hervorhebungsart verwendet, in Fassung c jedoch zwei Hervorhebungsarten: kursiv und unterstrichen.
Varianz von Seitenumbrüchen und Seitennummern
Unterschiedliche Seitenumbrüche und Seitennummern werden nicht auf die Art und Weise erfasst, wie es am Anfang des Kapitels beschrieben wurde. Stattdessen wird im <pb> mit edRef der jeweiligen Fassung erfasst. Siehe hierfür auch Seitenumbrüche.
Auf die gleiche Art und Weise werden Seitenzahlen und Seitenumbrüche in Fuß- und Endnoten texkritisch erfasst.
Beispiel Varianz von Seitenumbrüchen und Seitennummern
Besondere Dokumententypen
Lexikoneinträge
In Lexikoneinträgen werden die Lemmata oft innerhalb des Artikels abgekürzt. Da dies keine globalen Abkürzungen sind, werden sie an Ort und Stelle mit <choice>, <abbr> und <expand> erfasst.
Beispiel Abkürzungen von Lemmata
Zusammengesetzte Monografien
Das Gesamtwerk von Klaus Mollenhauer enthält einige sogenannte "zusammengesetzte Monografien": Bücher, die als Monografien erscheinen, aber deren Kapitel teilweise vorher oder später als Aufsätze in Sammelbänden oder Zeitschriften veröffentlicht wurden. Ziel ist es, einerseits die Monografie als Gesamtpublikation und gegebenenfalls textkritisch darzustellen und gleichzeitig auch die Textgenese der Aufsätze/Kapitel darzustellen.
Hierfür müssen fünf Aspekte beachtet werden:
- <notesStmt> im <teiHeader>
- <sourceDesc> der zusammengesetzten Monografien
- <sourceDesc> der Aufsätze/Kapitel
- Einbindung der Aufsätze in die zusammengesetzte Monografie
- Einbindung der Kapitel in Aufsatzveröffentlichungen
- Textkritik
<notesStmt> im <teiHeader>
Im <teiHeader> wird erfasst, das Aufsätze gleichzeitig Teil von Monografien sind bzw. andersherum, dass Teile einer Monografie als Aufsätze veröffentlicht wurden. Hierfür werden folgende Elemente genutzt:
Das <notesStmt> wird in der <fileDesc> platziert (zwischen <seriesStmt> und <sourceDesc>). Das <notesStmt> ist ein Container-Element für <note>.
Für jede Beziehung zwischen Aufsatz und Monografie gibt es ein <note>. Im <note> wird im textlichen Inhalt folgende Formulierung genutzt: "Teilw. zugl. ..." und der Titel des Textes, auf den verwiesen wird.
Dieser Titel wird in einem <ref> erfasst, das mit type=likewise spezifiziert ist. Mit target wird auf den TextGrid-URI des Textes verwiesen.
Beispiel <notesStmt> in einer zusammengesetzten Monografie
Beispiel <notesStmt> in einem Aufsatz
<sourceDesc> der zusammengesetzten Monografien
Grundsätzlich ist die <sourceDesc> einer zusammengesetzten Monografie ganz ähnlich wie die <sourceDesc> eines anderen Textes. Die Besonderheit besteht darin, dass Großbuchstaben verwendet werden und nur die Fassungen und Ausgaben der Monografie angegeben werden (und nicht die früheren/späteren Publikationen der Kapitel).
Beispiel <sourceDesc> der zusammengesetzten Monografien
<sourceDesc> der Aufsätze/Kapitel
Grundsätzlich ist die <sourceDesc> der Aufsätze/Kapitel ganz ähnlich wie die <sourceDesc> eines anderen Textes. Die Besonderheit besteht darin, dass nicht nur die Veröffentlichungen als Aufsätze, sondern auch die Veröffentlichungen als Kapitel als Fassungen und Ausgaben erfasst werden. Dabei sind die Fassungen der Aufsatz-Veröffentlichungen mit Kleinbuchstaben gekennzeichnet und die Fassungen der Kapitel-Veröffentlichungen mit Großbuchstaben. Dabei werden die gleichen xml:id wie im <teiHeader> der zusammengesetzten Monografie verwendet.
Für die Fassungen der Kapitel-Veröffentlichungen soll keine Einzelansicht generiert werden, da diese nie in dieser Form publiziert wurden. Deshalb werden die entsprechenden <witness> mit sade:singleview=false und xmlns:sade=https://mollenhauer-edition.de/ns/sade spezifiziert.
Beispiel <sourceDesc> der Aufsätze/Kapitel
Einbindung von Aufsätzen in die zusammengesetzte Monografie
Es sind zwei unterschiedliche Fälle zu unterscheiden: Erstens, wenn ein Kapitel schon früher als Aufsatz in einem Sammelband oder einer Zeitschrift veröffentlicht wurde. Dann gibt es im <body> der zusammengesetzten Monografie ein leeres <div>, das via copyOf auf das entsprechende <div> in der TextGrid-Ressource des Aufsatzes verweist.
Zweitens, wenn das Kapitel lediglich später als Aufsatz in einem Sammelband oder einer Zeitschrift veröffentlicht wurde. Dann wird es als ein ganz gewöhnliches Kapitel in der zusammengesetzten Monografie erfasst. Lediglich das <div> wird mit einer xml:id versehen.
Beispiel: Einbindung von Aufsätzen in die zusammengesetzte Monografie 1
Beispiel: Einbindung von Aufsätzen in die zusammengesetzte Monografie 2
Einbindung der Kapitel in Aufsatzveröffentlichungen
Hierbei geht es um zwei unterschiedliche Fälle: Erstens, dass Kapitel/Aufsatz erstmals als Aufsatz in einem Sammelband oder einer Zeitschrift veröffentlicht wurde. In diesem Fall wird der Text in der TextGrid-Ressource des Aufsatzes erfasst. Das <div> wird mit einer xml:id gekennzeichnet.
Zweitens, dass Kapitel/Aufsatz erstmals als Kapitel der zusammengesetzten Monografie veröffentlicht wurde. In diesem Fall wird der Text in der TextGrid-Ressource der zusammengesetzten Monografie erfasst. In der TextGrid-Ressource des Aufsatzes verweist ein leeres <div> via copyOf auf das entsprechende <div> in der zusammengesetzten Monografie.
Beispiel: Einbindung der Kapitel in Aufsatzveröffentlichungen 1
Beispiel: Einbindung der Kapitel in Aufsatzveröffentlichungen 2
Textkritik bei zusammengesetzten Monografien
Die Textkritik funktioniert grundsätzlich genauso wie bei anderen Publikationen auch. Zu beachten ist nur, dass zwischen Groß- und Kleinbuchstaben bei den wit unterschieden wird. Außerdem werden immer alle möglichen Fasungen eines Textes erfasst: In einem Kapitel einer zusammengesetzten Monografie, das später noch in drei Fassungen als Aufsatz veröffentlicht wurde, werden nicht nur die zwei Fassungen der Monografie, sondern auch die drei Aufsatz-Fassungen vermerkt (obwohl die verwendeten Werte "a", "b" und "c" in wit gar kein Ziel im <teiHeader> der Monografie haben).
Zitation der KMG-Texte
Um die Zitationsfähigkeit des Webportals zu gewährleisten und die eine analoge Zitation von Webportal und Printausgabe zu ermöglichen, werden Randnummern erzeugt. Dies geschieht automatisiert, nachdem das Werk in seinen Grundstrukturen (alle Kapitel, Abschnitte und Textabschnitte sowie die Textkritik) in TEI erfasst wurde.
Die Randnummern werden pro KMG-Text fortlaufend an die absatzartigen Kind-Elemente von <div>s vergeben. Folgende Elemente werden nummeriert (n):
- <p>
- <item> (mit Ausnahme von <item> in <list>type=abbildungstext
- <table>
- <lg>
- <epigraph>
- <milestone> mit type=paragraph
- <seg> mit type=transposition
Die Nummerierung erfolgt nach folgendem Schema: KMG-Nummer, Doppelpunkt und Randnummer (012:13 für den dreizehnten Textabschnitt in KMG-012).
Appendix A Formal declaration
Specification []
Module: analysis | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: core | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: figures | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: header | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: linking | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: namesdates | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: spoken | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: tagdocs | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: tei | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: textcrit | |||||||||||||||||||||||||||||||||||||||||||||||||||
Module: textstructure | |||||||||||||||||||||||||||||||||||||||||||||||||||
<valList type="closed">
<valItem ident="de-1901">
<gloss>de-1901</gloss>
<desc xml:lang="de-1901">Deutsch nach alter Rechtschreibung</desc>
</valItem>
<valItem ident="de-1996">
<gloss>de-1996</gloss>
<desc xml:lang="de-1996">Deutsch nach neuer Rechtschreibung</desc>
</valItem>
<valItem ident="en">
<gloss>en</gloss>
<desc xml:lang="de">Englisch</desc>
</valItem>
<valItem ident="es">
<gloss>es</gloss>
<desc xml:lang="de">Spanisch</desc>
</valItem>
<valItem ident="el">
<gloss>el</gloss>
<desc xml:lang="de">Griechisch</desc>
</valItem>
<valItem ident="fr">
<gloss>fr</gloss>
<desc xml:lang="de">Französisch</desc>
</valItem>
<valItem ident="gmh">
<gloss>gmh</gloss>
<desc xml:lang="de">Mittelhochdeutsch</desc>
</valItem>
<valItem ident="gsw">
<gloss>gsw</gloss>
<desc xml:lang="de">Elsässisch/Schweizerdeutsch</desc>
</valItem>
<valItem ident="it">
<gloss>it</gloss>
<desc xml:lang="de">Italienisch</desc>
</valItem>
<valItem ident="la">
<gloss>la</gloss>
<desc xml:lang="de">Latein</desc>
</valItem>
<valItem ident="nds">
<gloss>nds</gloss>
<desc xml:lang="de">Niederdeutsch (im engeren Sinne), Plattdeutsch</desc>
</valItem>
<valItem ident="ne">
<gloss>ne</gloss>
<desc xml:lang="de">Niederländisch</desc>
</valItem>
<valItem ident="no">
<gloss>no</gloss>
<desc xml:lang="de">Norwegisch</desc>
</valItem>
<valItem ident="qnh">
<gloss>qnh</gloss>
<desc xml:lang="de">Neuhochdeutsch</desc>
</valItem>
<valItem ident="san">
<gloss>san</gloss>
<desc xml:lang="de">Sanskrit</desc>
</valItem>
</valList> |
att.global |
| ||||||
att.fragmentable | |||||||
att.divLike |
| ||||||
att.declaring |
@corresp |
|
@corresp | |||||
@rend |
| ||||
@type |
|
@n |
@rend |
| ||||||||||
@role |
|
@status |
| ||||||||||||||||||
@when | |||||||||||||||||||
@who |
@prev |
@from | |||||||||||||||
@unit |
|
@resp | |||
@type |
|
@type |
|
@type |
|
@subtype |
| ||||||||||||||||||||||||||||
@type |
|
<alternate minOccurs="0" maxOccurs="1">
<textNode/>
<classRef key="model.gLike"/>
<classRef key="model.qLike"/>
<classRef key="model.phrase"/>
<classRef key="model.global"/></alternate> | |||||||||||||
@role |
|
@rend |
| ||||||||||||||
@type |
|
<sequence>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/>
<sequence minOccurs="0">
<elementRef key="front"/>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/></sequence>
<alternate minOccurs="0" maxOccurs="1">
<elementRef key="body"/>
<elementRef key="group"/></alternate>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/>
<sequence minOccurs="0">
<elementRef key="back"/>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/></sequence></sequence> | |||
@type |
|
<alternate minOccurs="0"
maxOccurs="unbounded">
<textNode/>
<classRef key="model.graphicLike"/>
<classRef key="model.hiLike"/>
<anyElement require="http://www.w3.org/1998/Math/MathML"/></alternate> |
@reason |
| ||||||||
@unit |
|
@mimeType |
|
@type |
|
@rend |
|
@type |
|
@rend |
|
@rend |
| ||||||||||||||||||
@result |
| ||||||||||||||||||
@scope |
| ||||||||||||||||||
@type |
|
@type |
|
@ident |
<sequence>
<alternate minOccurs="0"
maxOccurs="unbounded">
<classRef key="model.divTop"/>
<classRef key="model.global"/></alternate>
<alternate>
<classRef key="model.lLike"/>
<classRef key="model.stageLike"/>
<classRef key="model.labelLike"/>
<elementRef key="lg"/>
<elementRef key="cit"/>
<elementRef key="q"/>
<elementRef key="quote"/></alternate>
<alternate minOccurs="0"
maxOccurs="unbounded">
<classRef key="model.lLike"/>
<classRef key="model.stageLike"/>
<classRef key="model.labelLike"/>
<classRef key="model.global"/>
<elementRef key="lg"/>
<elementRef key="cit"/>
<elementRef key="q"/>
<elementRef key="quote"/></alternate>
<sequence minOccurs="0"
maxOccurs="unbounded">
<classRef key="model.divBottom"/>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/></sequence></sequence> | |||||
@rend |
|
<alternate minOccurs="0"
maxOccurs="unbounded">
<textNode/>
<classRef key="model.divLike"/>
<classRef key="model.divPart"/>
<classRef key="model.gLike"/>
<classRef key="model.phrase"/>
<classRef key="model.inter"/>
<classRef key="model.global"/>
<classRef key="model.rdgPart"/>
<elementRef key="head"/>
<elementRef key="item"/></alternate> | ||
@wit |
@target |
|
<sequence>
<alternate minOccurs="0"
maxOccurs="unbounded">
<classRef key="model.divTop"/>
<classRef key="model.global"/>
<elementRef minOccurs="0"
maxOccurs="unbounded" key="desc"/></alternate>
<alternate>
<sequence minOccurs="0"
maxOccurs="unbounded">
<elementRef key="item"/>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/></sequence>
<sequence>
<elementRef minOccurs="0" key="headLabel"/>
<elementRef minOccurs="0" key="headItem"/>
<sequence minOccurs="1"
maxOccurs="unbounded">
<elementRef key="label"/>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/>
<alternate>
<elementRef key="item"/>
<elementRef key="join"/></alternate>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/></sequence></sequence></alternate>
<sequence minOccurs="0"
maxOccurs="unbounded">
<classRef key="model.divBottom"/>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.global"/></sequence></sequence> | |||||||||||||
@rend |
| ||||||||||||
@type |
|
<sequence>
<elementRef minOccurs="0"
maxOccurs="unbounded" key="desc"/>
<alternate minOccurs="0"
maxOccurs="unbounded">
<elementRef key="prefixDef"/>
<elementRef key="listPrefixDef"/></alternate></sequence> |
@mimeType |
|
@rend |
| ||||||
@type |
| ||||||
@unit |
|
@type |
| ||||||||||||||
@subtype |
|
@anchored |
| ||||
@place |
| ||||
@subtype |
| ||||
@type |
|
@rend |
|
@rend |
|
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.pLike"/> |
@rend |
|
@rend |
|
<alternate minOccurs="0"
maxOccurs="unbounded">
<textNode/>
<classRef key="model.divLike"/>
<classRef key="model.divPart"/>
<classRef key="model.gLike"/>
<classRef key="model.phrase"/>
<classRef key="model.inter"/>
<classRef key="model.global"/>
<classRef key="model.rdgPart"/>
<elementRef key="head"/>
<elementRef key="item"/></alternate> | |||
@wit | |||
@type |
|
@target | |||||||||
@type |
|
@rend |
| ||
@role |
|
@type |
|
@rend |
|
@rend |
| ||||||||||||||||
@type |
|
<alternate>
<classRef minOccurs="0"
maxOccurs="unbounded" key="model.pLike"/>
<sequence>
<elementRef minOccurs="0"
maxOccurs="unbounded" key="title"/>
<alternate minOccurs="0"
maxOccurs="unbounded">
<elementRef key="editor"/>
<elementRef key="respStmt"/></alternate>
<alternate minOccurs="0"
maxOccurs="unbounded">
<elementRef key="idno"/></alternate></sequence></alternate> |
@cols | |||
@rend |
| ||
@rows |
@key |
|
@type |
| ||||
@xml:id |
| ||||
@xml:lang |
@type |
|
@type |
|
@rend |
| ||||||||||||||||||||||||||||||
@singleview |
|
- Holder of rights
- Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts: Niedersächsische Staats- und Universitätsbibliothek Göttingen
- Citation Suggestion for this Object
- TextGrid Repository (2025). Weitere Materialien. KMG-Schema (odd). KMG. Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts: Niedersächsische Staats- und Universitätsbibliothek Göttingen. https://hdl.handle.net/21.11113/0000-0016-DA80-1