Export

Zum Export von Belegen aus GiesKaNe bietet Annis verschiedene Exporter an. Um zu den Exportern zu gelangen, muss unterhalb der Suchanfrage More > Export ausgewählt werden:

Nun können fünf unterschiedliche Exporter ausgewählt werden. Die Exporter eignen sich für verschiedene Szenarien unterschiedlich gut, in der folgenden Tabelle finden Sie einen groben Überblick über die Möglichkeiten der Exporter.

Tabelle: Übersicht der verschiedenen Exporter

CSV-Exporter

CSV-Exporter

Der CSV-Exporter exportiert nur die vom Benutzer gesuchten Elemente und ignoriert den Kontext um die Suchergebnisse. Er ist der einzige von Annis bereitgestellte-Exporter, der es erlaubt die in der Baumbank hinterlegten Informationen zu exportieren. Die Werte für alle Annotationen jedes gefundenen Knotens werden in einer CSV-Tabelle ausgegeben. Hierbei enthält jeder Ausdruck, der Teil der Suchanfrage ist (tok = „so“ ist ein Ausdruck, tok = „so“ . tok = „gut“ sind zwei Ausdrücke), zusätzlich lassen sich die Metadaten der Belege erfassen. Hierzu muss unter Parameters spezifiziert werden, welche Metakeys exportiert werden. Wichtig ist hierbei, keine Leerzeichen aufzunehmen. Sollen etwa das Jahrhundert und die Konzeption Teil des Exports sein, muss unter Parameters metakeys=zeit,konzeption angegeben werden. Dies gilt auch für die anderen Exporter.

Übersicht über die aktuell verfügbaren Metadaten in GiesKaNe


Ein Problem des CSV-Exporters liegt darin, dass es über die Suchanfrage hinaus nicht möglich ist zusätzlichen Kontext um den Beleg zu erfassen. Wenn man also den Satz oder Teilsatz rund um den Beleg benötigt, muss dieser Teil der ursprünglichen Suchanfrage sein. Zudem werden Annotationen, die den Baum betreffen für jeden Text einzeln erfasst und müssen anschließend wieder zusammengeführt werden.

GridExporter

Der GridExporter kann alle Annotationen eines Suchergebnisses und dessen Kontext exportieren. Jede Annotationsebene wird in einer separaten Zeile dargestellt, und die von der Annotation abgedeckten Token werden als Zahlenbereiche hinter jeder Annotation in Klammern angegeben. Um die Token-Nummern zu unterdrücken, muss numbers=false in das Parameterfeld eingegeben werden. Um Token und die Annotation wa und wasub anzeigen zu lassen, ist es erfoderlich, in das Textfeld „Annotation keys“ z. B. „tok,wa,wasub“ einzugeben.

Indem „tree“ in die Annotation keys aufgenommen wird, können auch die Baumannotationen erfasst werden, werden allerdings als einzelne Zeile erfasst und zeigen mittels Ziffern an, auf welchen Teil des exportierten Belegs sie sich beziehen.

Die anderen Exporter

Bei den anderen Exportern lässt sich nur die Tokenebene exportieren.

SimpleTextExporter

Der SimpleTextExporter exportiert nur den reinen Text jedes Suchergebnisses.

TextColumnExporter

Der TextColumnExporter exportiert die vom Kontext umgebenen Treffer als txt-Datei. Die Spalten werden durch Tabulatorzeichen getrennt.

TokenExporter

Der Token Exporter exportiert das Token, das von den Knoten des Suchergebnisses und dessen Kontext abgedeckt wird, eine Zeile pro Ergebnis. Neben dem Text des Tokens enthält er auch alle Token-Annotationen, die durch „/“ getrennt sind.