Regeln zur Erstellung der TXT-Dateien aus den TEI-kodierten Transkriptionen: In der Regel gibt es eine TXT-Datei pro Edition. Um die Dateigröße zu begrenzen oder aus inhaltlichen Gründen konnte allerdings von dieser Regel abgewichen werden, sodass einige wenige Editionen in mehrere TXT-Dateien aufgeteilt wurden. (Kleinere Einheiten sind nicht miteinander vergleichbar, da unterschiedliche Einheiten in den verschiedenen Editionen gewählt wurden.) Sämtliches XML-Markup wird getilgt. Alle editorischen Zusätze (Anmerkungen, Fußnoten, Annotationen) werden getilgt, so dass nur der ‘historische’ Transkriptionstext übrig bleibt. Bei / wird getilgt. Bei / wird getilgt. Bei / wird getilgt. wird getilgt. und werden übernommen. Zeilenumbrüche brauchen nicht übernommen werden, da in einigen Editionen keine ausgezeichnet wurden. Durch Zeilenumbrüche getrennte Wörter werden nach Möglichkeit zusammengefügt. @xml:lang o.ä. fällt weg. Stattdessen werden die in der Edition vorkommenden Sprachen in der Metadaten-Tabelle erfasst. Bei mehreren in (wenn kein vorhanden) werden alle außer dem ersten getilgt. Kolumnentitel, die mit kodiert werden und den Fließtext, manchmal auch einzelne Wörter unterbrechen, fallen weg.