Mid-year recap

2016 has been quite a ride so far. Half the year is gone now and I just got the fourth journal article accepted today (for the records, it’s June, 22nd, 2016). Given my track record so far in the last years, that’s an increase one cannot even calculate. Last year, around the same time, I was seriously considering alternatives to academia, as it was completely unclear, wether I would be able to meet the fundamental conditions of my tenure agreement. Neither the necessary amount of high-profile publications nor the mandatory research stay abroad were to be seen on the horizon. Surely, I had been working on getting out the results of the projects I completed over the last years and also had screened the my research community for groups potentially hosting me as a guest research — but neither of activities had come to fruition by then and I was fully occupied with finalizing the administrative details of the EU-funded project IANES, which I was responsible for at that time.

Fast forward one year, I’m currently sitting in the Netherlands, spending 10 months at Radboud university and HAN university of applied sciences as a guest researcher. This stay is funded by an Erwin-Schrödinger-Fellowship of the Austrian Science Funds, which provides my with complete freedom to pursue my research and fully focus on the topics I wanted to work on for years, but never found the time. And what’s more, 2016 has seen my publication efforts finally lead to tangible results — the four articles, which are already published, and quite a few more that are in their final stages of revision.

This rise in tangible output might seem strange — at least it is to me, when trying to looking at it from the outside. But ever since I finished the work on IANES in October, I managed to never get out of the habit of writing and — later on — revising. This finally led to submitting several articles in fall, of which three have appeared by now, together with the fourth one that already had been under revision earlier in 2015. Two more articles are currently in their final round of revision, and since I started my fellowship, I have submitted two more articles that already move beyond what I have been working on over the last years. This level of productivity retrospectively is sometimes perplexing, and I often wonder how long I will be able to keep up this pace. But one need to take the opportunity when it’s there — so I try to just let it happen.

There are already new opportunities showing up on the horizon — opportunities that might take me somewhere else content-wise and open new fields of research and artifact design. There is a perspective for me to remain in academia, being one of the few privileged, who can make a living from solely doing what they are interested in and love, and try to at least contribute a little to pushing the borders of what we know and what we can do. While this sounds really pathetic and maybe a bit far-fetched, it still has been what kept me going all these years. I was really lucky to meet people ever since I graduated, who let me pursue what I found interesting and necessary at the given time. There were a number of mind-boggling coincidences that shaped my way and kept me going into directions I never had imagined. And there is my family, who accepts and supports me in what I’m doing to an extent that must not be taken for granted (especially now, when I’m away most of the time).

Overall, after all this doubts and near-burnout-situations over the last years, I finally get the impression that what I’m doing might not only make sense to me but also to others, and that there indeed is a slight chance that my work will make a difference someday. If I’ve learned something over the last years, it might have been the realization that elaborate plans are only good to reassure others, but hardly ever have to do anything with how things actually work out. By now, I merely try to recognize opportunities, when they emerge — which is actually the hardest part — and then do nearly everything to realize them. This is what keeps me quite busy by now … and hopefully will continue to do so for a long time.

Der Abstract

Der Abstract (oder zu deutsch: Die Kurzfassung) ist die Visitenkarte eines wissenschaftlichen Artikels. Neben dem Titel, den Name in der Autoren und einigen Schlüsselwörtern ist er oft die einzig öffentlich und frei zugängliche Informationen über einen wissenschaftlichen Artikel. Da der Zugriff auf den Volltext des Artikels oft kostenpflichtig oder zumindest mit Mehraufwand verbunden ist, muss einem potentiellen Lesenden mit dem Abstract die Relevanz des Artikels vermittelt werden. Es muss klar werden, warum es der Artikel wert ist, gelesen zu werden.

Der Abstract steht zu Beginn jedes Artikels, sollte aber als letztes geschrieben werden – deshalb wird er hier am Ende des Kapitels über die Strukturierung eines wissenschaftlichen Arbeit diskutiert. Der Abstract ist hinsichtlich seines Inhalts nicht als Teil des Artikels zu betrachten, sondern muss unabhängig von diesem stehen können. Er sollte die wesentlichen Inhalte des Artikels in Kurzform darstellen, also die Zielsetzung, die Vorgehensweise und die Kernerkenntnisse vorwegnehmen. Auch wenn der Abstract dadurch gewissermaßen die Spannung aus dem eigentlichen Artikel nimmt, muss letzterer ebenfalls vollständig für sich stehen können. In der Einleitung darf nicht auf Argumentationen im Abstract Bezug genommen werden, die Einleitung muss das Thema des Artikels von Grund auf aufrollen. Aus diesen Ansprüchen ergibt sich, dass der Abstract idealerweise als letzter Teil eines Artikels geschrieben wird – dann, wenn die Argumentation des eigentlichen Artikels vollständig und in sich abgeschlossen ist und sowohl Ziel, Vorgehensweise und Ergebnisse fertig beschrieben sind.

Inhalt

Der Abstract enthält auf jeden Fall das Thema des Artikels, seine Zielsetzung, die Vorgehensweise bei der Bearbeitung des selben, und letztendlich die wesentlichen Ergebnisse des Artikels. Der Text sollte dabei nicht wörtlich aus dem Eigentlichen Artikel übernommen werden, sondern in Anbetracht der notwendigen Kürze und Kompaktheit neu formuliert werden. Dies ist insbesondere auch wichtig, weil im Abstract üblicherweise keine Literaturreferenzen angegeben werden. Aussagen, die eines Belegs bedürfen, sollten deshalb vermieden werden.

Bei in deutscher Sprache verfassten Artikeln ist es oft üblich, zusätzlich zur deutschen Kurzfassung auch noch einen englischen Abstract zu formulieren, damit zumindest die Existenz der gegenständlichen Forschungsarbeit in der internationalen Forschergemeinschaft rezipiert werden kann.

Je nach Publikationsart ist ein Abstract unterschiedlich lang – bei kürzeren wissenschaftlichen Artikeln ist der Abstract nicht länger als ein kurzer Absatz, bei umfangreicheren Zeitschriftenartikeln enthält er 200-300 Wörter, was je nach Formatierung etwa einer halben Seite entspricht. Bei längeren Arbeiten wie Dissertationen oder Masterarbeiten ist der Abstract entsprechend dem höheren Gesamtumfang etwas länger, übersteigt aber selten eine Länge von einer Seite. In Monographien oder Lehrbüchern gibt es im Normalfall keinen Abstract, da diesen keine einzelne Forschungsfrage zugrunde liegt, die auf den Punkt gebracht zusammengefasst werden könnte. In Sammelwerken erhält oft jeder Teilartikel einen eigenen Abstract, da diese in ihrer Aufbereitung oft Zeitschriftenartikeln ähneln.

Beispiel

Im folgenden wird anhand des Abstracts des Artikels

Oppl, S. (2015). Articulation of subject-oriented business process models. Proc. Of S-BPM One 2015, 1–11. http://doi.org/10.1145/2723839.2723841

gezeigt, wie der Abstract eines Konferenzartikels beispielhaft strukturiert werden kann:

Im ersten Satz wird das Thema, hier das Erheben von Wissen über Geschäftsprozesse, umrissen.

Business process elicitation needs to capture, document, and share the expertise and experiences develop over time by the involved workers.

Danach wird die Zielsetzung des Papers beschrieben. Dies ist so formuliert, dass klar wird, womit sich der Artikel im Detail beschäftigt.

This paper presents an approach for elicitation of subject-oriented business process models from operatively involved people, who are not expert modelers. The approach facilitates individual articulation and collaborative consolidation of work knowledge.

Die folgenden Sätze detaillieren die Vorgehensweise bei der Erreichung des Ziels. Da es sich bei dem betrachteten Artikel um eine Beschreibung eines prototypisch umgesetzten Systems handelt, fokussiert dieser Teil auf die entwickelten methodischen und technischen Komponenten.

An instrument based on physical structure elaboration techniques is introduced to represent procedural knowledge in conceptual models of collaborative work. These physical models are captured digitally and transformed to syntactically correct S-BPM models. Capturing is supported by interactive tools, which allow to correct syntactic errors. Semantic completeness of the models is archived by interactive refinement during simulated enactment using a process validation engine.

Abschließend geht der Abstract darauf ein, was die Ergebnisse des Forschungsprozesses waren, über den im Artikel berichtet wird. Im Beispiel wird dazu ausgeführt, dass die Umsetzbarkeit des vorgeschlagenen Ansatzes anhand von Fallstudien gezeigt werden konnte und dass Anforderungen an weitergehende Unterstützungsmaßnahmen abgeleitet werden konnten.

The paper shows the feasibility of the approach in two case studies and identifies requirements on interactive guidance during model capturing and interpretation.

Wie immer gilt auch für dieses Beispiel, dass es nicht die einzige Möglichkeit zur Strukturierung eines Abstracts darstellt. Es stellt auch nicht den Anspruch, besonders gut formuliert zu sein, zeigt aber anschaulich die unterschiedlichen Inhalte, die mit einem Abstract abgedeckt werden müssen.

Exzerpieren

Unter „Exzerpieren“ versteht man das zielgerichtete Zusammenfassen eines wissenschaftlichen Textes. Wichtig ist in diesem Zusammenhang die Betonung des Wortes „zielgerichtet“. Jeder wissenschaftliche Artikel enthält mit dem Abstract bereits eine Zusammenfassung, die grundsätzlich zur Charakterisierung des Artikels herangezogen werden kann. Allerdings ist es sehr unwahrscheinlich, dass der Abstract exakt jene Information enthält, die im Zusammenhang mit der Fragestellung relevant ist. Das Exzerpieren hat deshalb das Ziel, einen wissenschaftlichen Artikel so zusammenzufassen, dass das Exzerpt jene Information enthält, die zur Bearbeitung der eigenen Fragestellungen genutzt werden kann. Letztendlich soll das Exzerpt den Artikel beim eigentlichen Verfassen der wissenschaftlichen Arbeit ersetzen können.

Eine allgemein gültige Längenangabe für Exzerpte ist deshalb nicht möglich. Bei sehr fokussierten Fragestellungen oder Artikeln, die den eigenen Forschungsbereich nur am Rande berühren, kann ein Exzerpt wenige Zeilen lang sein, bei Artikeln, die über Arbeiten nahe der eigenen Forschungsfragen berichten, kann ein Exzerpt auch länger sein und einige Seiten umfassen.

Vorgehen beim Exzerpieren

Der Schlüssel zum Erfolg beim Verfassen eines Exzerpts liegt in der Formulierung möglichst klar beantwortbarer Fragen an den jeweils exzerpierten Text. Wenn diese Fragen explizit und eindeutig formuliert werden, kann im Quelltext zielgerichtet nach der jeweiligen Information gesucht werden. Ein mögliches und zulässiges Ergebnis ist hier im Übrigen, dass der Quelltext zu einer bestimmten Frage keine Aussage trifft. Auch diese Erkenntnis kann beim späteren Verfassen der eigenen wissenschaftlichen Arbeit sinnvoll eingesetzt werden.

Wenn wir nun die oben als Beispiel angeführte Fragestellung

„Welche Möglichkeiten zur Beurteilung der Benutzbarkeit von Authentifizierungsmechanismen in sicheren Instant Messaging Systemen wie X und Y gibt es?“.

als Grundlage unserer Exzerpierungs-Fragen heranziehen, müssen wir bei deren Formulierung bedenken, dass wir bei der Literatursuche bereits Artikel ausgewählt haben, die grundsätzlich relevant erschienen sind, also augenscheinlich Antworten auf unsere Fragestellung liefern könnten. Die Exzerpierungs-Fragen sollen nun so formuliert werden, dass sie jene Informationen umfassen, die die spätere Beantwortung der Fragestellung in der eigentlichen Arbeit ermöglichen. Konkrete Exzerpierungs-Fragen könnten also sein:

„Welche Authentifizierungsmechanismen für sicheres Instant Messaging nennt der Text?“

„Welche Methoden zur Beurteilung der Benutzbarkeit wurden verwendet?“

„Welche Ergebnisse nennt der Text hinsichtlich der Benutzbarkeit der behandelten Authentifizierungsmechanismen?“

An dieser Stelle ist es wichtig, anzumerken, dass nicht notwendigerweise ein Satz an Fragen für alle auszuwertenden Artikel zur Anwendung kommt. Vielmehr sind die Fragen für den jeweiligen Untersuchungsgegenstand zusammenzustellen – wenn die eigene Fragestellung so breit ist, dass sie in mehreren Schritten bearbeitet werden muss, werden auch unterschiedlich fokussierte Exzerpte benötigt werden. Unter Umständen kann es sinnvoll sein, für einen Quelltext unterschiedliche Exzerpte anzufertigen, die auf den jeweiligen Untersuchungsfokus abgestimmt sind.

Darüber hinaus kann es sinnvoll sein, Fragen zu formulieren, die über den Kernbereich der eigenen Fragestellung hinausgehen. Etwa

„Nennt der Text neben der Benutzbarkeit weitere Einflussfaktoren auf die Akzeptanz eines Authentifizierungsmechanismus?“

Bei der Ausarbeitung eines Exzerpts ist es sinnvoll, die formulierten Fragen direkt zu beantworten. Die Aufbereitung ist Gegenstand des nächsten Abschnitts.

Aufbereitung eines Exzerpts

Ein Exzerpt sollte strukturiert anhand der betrachteten Fragen aufgebaut sein. Sinnvoll ist es hier, jeder Fragen einen explizit (etwa durch eine separate Überschrift) gekennzeichneten Abschnitt zu widmen. Zusätzlich enthält das Exzerpt einen Kopfbereich, in dem der Titel des Artikels, sowie idealerweise die volle Referenz angeführt sind. Wenn der Quelltext nicht ohnehin digital vorliegt, ist es sinnvoll, hier auch noch die Bezugsmöglichkeit anzuführen, um — falls notwendig — nochmals auf die ursprüngliche Quelle zurückgreifen zu können. Da zwischen der Exzerpierung und dem Verfassen der eigentlichen Arbeit durchaus einige Zeit vergehen kann, ist das Verschriftlichen dieser Information anzuraten.

Beim Exzerpieren selbst dürfen durchaus Teile des Originaltextes in das Exzerpt wörtlich übernommen werden. Wichtig ist es aber, diese wörtliche übernommenen Teile zu kennzeichnen, da bei der späteren Übernahme der Inhalte in die eigentliche wissenschaftliche Arbeit wörtliche Zitate explizit gekennzeichnet werden müssen. Eine Kennzeichnung erfolgt üblicherweise durch Anführungszeichen oder kursiven Textsatz. Bei längeren Passagen kann auch eine Einrückung der übernommenen Teile dabei helfen, deren Beginn und Ende klar zu erkennen. In jedem Fall sollte bei wörtlicher Übernahme eines Textteils die Seitenzahl im Quelltext mit vermerkt werden, da diese Information für etwaige spätere wörtliche Zitate notwendig ist.

Generell sollte aber eine Übernahme von Originalstellen eher sparsam erfolgen, das für die spätere Verwendung eine Aufbereitung der Inhalte im Sinne der eigenen Fragestellung zumeist ohnehin notwendig sein wird. Ob diese Umformulierung bereits beim Exzerpieren vorgenommen wird oder erst im Rahmen der Zusammenführung der Inhalte, ist individuell unterschiedlich. Vor allem für den Fall, dass die Originalquelle nicht unbegrenzt zur Verfügung steht, ist ein unmittelbares Verfassen eigener Exzerpttexte (ggf. in Kombination mit zusätzlicher wörtlicher Archivierung der jeweils verwendeten Passagen) aber anzuraten. Als Zwischenschritt ist manchmal — vor allem bei permanenter Verfügbarkeit des Quelltextes — ein farbiges Markieren etwaiger relevanter Stellen hilfreich. Ein farblich markierter Quelltext stellt aber noch kein Exzerpt dar, da die strukturierte Darstellung der Inhalte im Sinne der formulierten Fragen fehlt.

Literaturverwaltung

Die wichtigste Regel in Bezug auf Literaturverwaltungen ist, eine zu benutzen. Egal, wie das Vorgehen bei der Literaturrecherche sonst aussieht, wichtig ist, dass das Ergebnis in einer Literaturverwaltungssoftware landet. Dafür gibt es zwei Gründe:

  • Einmal gefundene Quellen sind rasch und auf unterschiedlichen Suchpfaden wieder auffindbar. Dies vermeidet Ordner am Rechner, die man nach Jahren von „Literatur“ auf „unsorted“ umbenennt, und die unzählige kryptisch benannte PDFs enthalten, in denen Artikel ohne weitere Metadaten abgespeichert sind.
  • Der Aufwand für die Erstellung eines korrekt formatierten Literaturverzeichnisses wird massiv reduziert. Spätestens beim Ändern des Zitierstils in einem Artikel mit 60 Referenzen, weil sich das Zielmedium geändert hat, ist dieser Punkt leicht nachzuvollziehen.

Der Mehrwert einer Literaturverwaltung erschließt sich aber erst, wenn diese korrekt eingesetzt wird und wenn für das jeweilige Verwendungsszenario das geeignete Produkt gewählt wurde. Im folgenden werden wir deshalb zuerst auf die Verwendung von Literaturverwaltungssoftware eingehen, und danach die unterschiedlichen Produktkategorien in diesem Bereich hinsichtlich ihrer Stärken und Schwächen betrachten.

Nutzung einer Literaturverwaltung

Bei der Nutzung einer Literaturverwaltung sind im wesentlichen drei Schritte zu unterscheiden, die von der Software adäquat unterstützt werden sollten. Während der Literatursuche sollte die Software das Einpflegen von Daten möglichst einfach machen, so dass gefundene Quellen rasch und korrekt hinzugefügt werden können und zur weiteren Verwendung bereit stehen. Die Auswertung der verwalteten Literatur wird von den existierenden Produkten sehr verschieden gehandhabt und in unterschiedlichem Ausmaß unterstützt – während manchmal nur einfach Gruppierungsoperationen unterstützt werden, stellen andere Produkte umfangreiche Funktionalität zum Annotieren und Exzerpieren der verwalteten Artikel zur Verfügung. Letztendlich ist die Unterstützung bei der Erstellung wissenschaftlicher Artikel jene Funktionalität, die potentiell den stärksten unmittelbaren Mehrwert bzgl. Zeitersparnis und Vermeidung von Fehler bietet, indem Sie das Verzeichnis der in einem Artikel verwendeten Literatur entsprechend der Formatvorgaben des Publikationsorgans automatisiert erstellt.

Einpflegen von Daten in Literaturverwaltungen

Während der Literatursuche als möglicherweise relevant identifizierte Artikel sollten unmittelbar in die Literaturverwaltung importiert werden. Je nach verwendetem Produkt ist die unterschiedlich aufwändig. Die manuelle Eingabe der relevanten Metadaten sollte aber immer nur der letzte Ausweg sein, da dies aufwändig und fehleranfällig ist. Üblicherweise bieten Literaturverwaltungen eine Import-Schnittstelle an, die mit gängigen Metadatenformaten umgehen können. Datensätze in diesen Formaten stellen die meisten digitalen Bibliotheken zum Download bereit. Auch Literatursuchmaschinen wie der Googel Scholar können oft so konfiguriert werden, dass sie strukturierte Metadaten zu den Suchergebnissen zum Download anbieten. Manche Produkte, bieten auch Browser-Extensions an, die einen Import durch einen simplen Klick auf einen Toolbar-Button ermöglichen. Diese Extensions versuchen, die relevanten Metadaten automatisiert zu extrahieren, was nicht immer in der notwendigen Qualität gelingt.

Nach dem Import sollte die Literaturreferenz auf Korrektheit und Vollständigkeit geprüft werden. Vor allem bei automatisiert importierten Literaturreferenzen oder bei der Verwendung der durch eine Suchmaschine generierten Metadaten ist die Datenqualität oft mangelhaft, was den Nutzen der Literaturverwaltung bei der Generierung eines Literaturverzeichnisses zunichte macht oder sogar ins Gegenteil verkehrt.

Ein wesentlicher Stolperstein beim automatisierten Import ist eine fehlerhaft Festlegung der Literaturart eines Artikels. Für die Angabe der Referenz im Literaturverzeichnis ist es relevant, in welcher Form ein wissenschaftlicher Artikel erschienen ist. Zu einem Buchkapitel werden für die Quellenangabe andere Informationselemente benötigt als für einen Zeitschriftenartikel. Wird ein Zeitschriftenartikel nun etwa fehlerhaft als Buchkapitel importiert, werden zwar Titel, Autoren und Erscheinungsjahr korrekt angeführt werden, unter Umständen ist auch noch der Zeitschriftenartikel korrekt eingebunden. Die für einen Zeitschriftenartikel notwendige Angabe von Jahrgang und Ausgabe, in der der Artikel erschienen ist, wird jedoch in jedem Fall fehlen – entweder bereits in den Metadaten oder zumindest bei der Generierung des Literaturverzeichnisses. Literaturverwaltungen sind nämlich zumeist so aufgebaut, dass sie zu einem Artikel beliebige Informationselemente speichern können und erst bei der Generierung eines Literaturverzeichnisses auf Basis der festgelegten Literaturart ausgewählt wird, welche Element für die Erstellung der Referenz verwendet werden. Auch bei auf dem ersten Blick vollständigen Metadaten ist es also möglich, dass durch eine falsch festgelegte Literaturart die erzeugte Referenz unvollständig ist. Wird die Literaturart nach dem Import geändert, ist deshalb auf die korrekte Befüllung der Metadaten-Felder zu achten.

Nach dem Import sollte deshalb zuerst die Literaturart kontrolliert und ggf. korrigiert werden. Danach sollten die Metadaten auf Vollständigkeit kontrolliert werden. Welche Metadaten für welche Literaturart üblicherweise angegeben werden, wird im Abschnitt “Das Quellenverzeichnis” beschrieben. Soll die Literaturverwaltung nicht nur zur Generierung des Literaturverzeichnisses verwendet werden, sondern auch bei der eigentlichen wissenschaftlichen Arbeit unterstützen, so sollte im letzen Schritt auch der Volltext der Publikation als digitale Datei (zumeist als PDF) hinzugefügt werden, sofern dieser verfügbar ist. Literaturverwaltugen speichern diese Volltexte zumeist in von ihnen verwalteten Ordnerhierarchien im Dateisystem und verwendet dabei sprechende Datei- und Ordernamen, so dass die Volltext auch ohne die Literaturverwaltungs-Software auffindbar sind (gängig ist hier etwa eine Ebene an Ordnern mit den Namen der erstgenannten Autoren von Publikationen, in denen die jeweiligen Dateien mittels eines Namenschemas abgelegt sind, das zumindest die Namen der ersten zwei bis drei Autoren, das Erscheinungsjahr, sowie unter Umständen die ersten Worte des Titels der Publikation enthält. Ein Beispiel hierfür wäre (Ordnername -> Dateiname):

Oppl -> OpplStary2009TabletopConceptMapping.pdf

In dieser Form abgelegt, sind die verwalteten Volltexte auch einfach und nachvollziehbar etwa via eMail versendbar, weswegen – sofern überhaupt optional – von der Möglichkeit der automatisierten Verwaltung der Volltexte Gebrauch gemacht werden sollte.

Auswertung von verwalteter Literatur

In den Fähigkeiten zur Arbeit mit verwalteter Literatur unterschieden sich die am Markt befindlichen Produkte stark voneinander. Allen gemein ist jedoch, dass sie in der Lage sind, Publikationen in Gruppen zu organisieren. Während sich die dazu verwendeten Mechanismen wiederum unterscheiden (von statischer Kategorisierung, über Tagging, bis hin zu dynamische Gruppierung basierend auf Filterregeln), ist ihnen gemein, dass sie damit Literatur unabhängig von der Suche auf Basis der vorhandenen Metadaten einfacher auffindbar machen wollen.

Während hier kein allgemeiner Kategorisierungsleitfaden angegeben werden kann, soll doch auf zwei gängige Ansätze zur Strukturierung von Literaturquellen hingewiesen werden. Einerseits ist dies die Ablage nach Themenbereichen, andererseits die Zusammenfassung von Quellen, die gemeinsam in einem Artikel verwendet wurden.

Die erstgenannte Art der Strukturierung ist naheliegend. Wächst die Anzahl der Quellen in einer Literaturverwaltung über die Zeit hinweg an, so ist es wahrscheinlich, dass durch die unterschiedlichen bearbeiteten Fragestellungen Literatur zu unterschiedlichen Themen verwaltet wird. Um diese rasch und in ihrer Gesamtheit überblicken zu können, ist es sinnvoll, Publikation nach behandelten Themen zu kategorisieren. Dabei können auch die Keywords einer Publikation herangezogen werden, sinnvoller ist aber eine manuelle Kategorisierung nach selbst festgelegten, mit dem eigenen Forschungszugang abgestimmten Kategorien.

Die Gruppierung von Publikationen nach deren gemeinsamen Verwendung in einer Publikation ist eine Empfehlung, die der Arbeitspraxis des Autors dieses Skriptums entstammt. Dafür gibt es zwei Gründe. In Einzelfällen fordern Verlage von Autoren die in einem Artikel verwendete Literatur in einem strukturierten Metadatenformat an. Die meisten Literaturverwaltungen sind in der Lage, einen derartigen Export durchzuführen und dabei die exportierten Datensätze auch auf die einer bestimmten Gruppe zugeordneten Publikationen zu beschränken. Der mit dem Export verbundene Arbeitsaufwand reduziert sich damit auf einige wenige Mausklicks. Der zweite Grund liegt wie oben in der Wiederauffindbarkeit von Literaturquellen begründet. Es kommt bei einem längerfristigen Forschungsprojekt vor, dass mehrere Publikationen ähnlich Argumente enthalten, um etwa eine bestimmte Designentscheidung zu begründen. Erfahrungsgemäß ist es einfacher, sich zu erinnern, in welchem Artikel ein bestimmtes Argument verwendet wurde, als sich an die exakte Literaturquelle zu erinnern, die zum Beleg desselben verwendet wurde. Bei einer Gruppierung von Publikationen nach Verwendung in verfassten Artikeln sind damit Belege für bestimmte Argumente rascher wieder aufzufinden. Durch die beinahe immer vorhandene Möglichkeit der Mehrfachzuordnung einer Publikation zu mehreren Kategorien können die beschriebenen Ansätze zur Strukturierung auch kombiniert werden.

Neben der Gruppierung von Publikationen bieten einige Literaturverwaltungen auch Funktionen zur Arbeit mit den verwalteten Volltexten an. Diese umfassen üblicherweise die Möglichkeit zur Annotation einer Publikation, teilweise wird auch das Erstellen eines Exzerptes unterstützt. Die Annotationsfunktionalität ähnelt üblicherweise jener, die von PDF-Viewern bekannt ist und umfasst Möglichkeiten, einzelne Passagen durch Anstreichen hervorzuheben und Kommentare hinzuzufügen. Diese Annotationen werden üblicherweise einerseits im PDF eingebettet, andererseits aber auch in die Literaturdatenbank importiert, um dort für die Suche nach der Publikation bzw. zur Dokumentation relevanter Aspekte derselben verfügbar zu sein. Diese Übernahme von Annotationen bildet üblicherweise auch den Kern der Unterstützung des Exzerpierens. Dort besteht üblicherweise zusätzlich die Möglichkeit, selbst freien Text hinzuzufügen. Dies kann etwa dazu genutzt werden, die unterschiedlichen Aspekte, auf die beim Exzerpt eingegangen wird (siehe Abschnitt “Exzerpieren”) im Text vor zu strukturieren.

Letztendlich bieten einige Produkte die Möglichkeit, Teile der eignen Literaturdatenbank für andere Personen freizugeben, um diesen die Ansicht oder sogar die kollaborative Bearbeitung zu ermöglichen. Dies ist vor allem bei wissenschaftlichen Arbeiten nützlich, die nicht in Einzelautorenschaft erstellt werden, sondern an der mehrere AutorInnen beteiligt sind. In Art und Umfang der Freigabe unterscheiden sich die verfügbaren Produkte hier wiederum stark, weswegen hier nicht weiter auf Details eingegangen werden soll.

Unterstützung bei der Erstellung wissenschaftlicher Artikel

Während sich der Mehrwert einer Literaturverwaltung zur Auswertung der verwalteten Literatur meist erst bei längerer Verwendung zeigt, wird deren effizienzsteigernde Wirkung bei der Generierung des Literaturverzeichnisses eines Artikels unmittelbar sichtbar.

Jeder wissenschaftliche Artikel muss im Sinne der Nachvollziehbarkeit des Beitrags zum Stand der Forschung mit Referenzen auf bereits existierende Arbeiten versehen werden. Diese Referenzen werden im Text an jenen Stellen eingefügt, an denen auf die jeweilige Quelle Bezug genommen wird. Dies geschieht zur besseren Lesbarkeit in Form eines Kurzzitats (etwa durch Nummern in eckigen Klammern oder die Angabe der Autoren und des Erscheinungsjahrs einer Publikation in runden Klammern – siehe dazu den Abschnitt “Das Quellenverzeichnis”), die am Ende des Artikels im Quellenverzeichnis in eine vollständige Literaturreferenz aufgelöst wird. Die Form der Angabe des Kurzzitats und die Formatierung des Quellenverzeichnisses unterscheidet sich stark zwischen den Publikationsorganen, in denen ein Artikel erscheinen kann. Zudem kann vor allem bei nummernbasierten Kurzzitaten kann eine nachträgliche Änderung der verwendeten Quellen durch die notwendige Neunummerierung sehr aufwändig sein. Insgesamt ist die Erstellung des Quellenverzeichnisses und das korrekte Auflösen der Kurzzitate eine Aufgabe, die manuell sehr aufwändig und fehleranfällig ist, bei entsprechend vorhandenen Informationen über die Richtlinien des jeweiligen Publikationsorgans aber gut automatisiert werden kann.

Ein wesentliches Kennzeichen von Literaturverwaltungen bei deren Marktauftritten ist deswegen die Anzahl der unterstützten Formate für die Erstellung von Kurzzitaten und Quellenverzeichnissen.

Zur Verwendung bieten die meisten Produkte Extensions für gängige Textverarbeitungsprogramme an, die den Zugriff auf die verwaltete Literatur ermöglichen. Soll nun ein Kurzzitat in den Text eingefügt werden, wird in der Extension die jeweilige Quelle ausgewählt. Dies führt dazu, dass eine produktspezifischen Textmarke in den Text eingefügt wird, die später bei der abschließenden Formatierung durch das jeweils korrekt formatierte Kurzzitat ersetzt wird. In manchen Produkten ist diese Textmarke selbst sprechend, d.h. gibt Aufschluss über die verwendete Literaturquelle, was beim Editierprozess hilfreich sein kann.

Ist der Artikel fertiggestellt, kann die jeweilige Extension dazu verwendet werden, das Quellenverzeichnis zu generieren. Dazu muss üblicherweise Im ersten Schritt der zu verwendete Zitierstil gewählt werden. Die Literaturverwaltung scannt danach das Dokument nach den eingefügten Textmarken und ersetzt diese durch die jeweiligen Kurzzitate. Im Hintergrund werden die verwendeten Quellen gesammelt um dann in ein korrekt formatiertes Quellenverzeichnis zusammengeführt zu werden. Dieses wird üblicherweise automatisiert am Ende des Dokuments eingefügt. Viele Produkte sind in der Lage, diesen Prozess nicht nur einmal durchzuführen, sondern ermöglichen ein beliebiges Umformatieren der Kurzzitate und Quellenverzeichnisse. Dies kann notwendig sein, wenn ein Artikel bei einem anderen als dem ursprünglich geplanten Publikationsorgan eingereicht wird. Sinnvoll ist dies aber auch, wenn die finale Arbeit einen Zitierstil erfordert, der ein Editieren oder Korrekturlesen erschwert. Dies ist etwa bei nummernbasierten Kurzzitaten der Fall, die im Text keinen Rückschluss auf die verwendeten Quellen ermöglicht. Für derartige Zwecke kann so vorübergehend ein „sprechendes“ Format für Kurzzitate eingesetzt werden.

Software zur Literaturverwaltung

Software zur Literaturverwaltung gibt es heute wie in großer Auswahl. Historisch gesehen haben alle Produkte einen gemeinsamen Ahnen. Das BibTeX-System, dass im Kontext von LaTeX bereits in den 80er-Jahren entwickelt wurde, weißt im Wesentlichen bereits alle Eigenschaften auf, die auch moderne Systeme auszeichnen. Insbesondere führt BibTeX einen Ansatz zur Verwaltung der Metadaten ein, der unterschiedliche Artikeltypen (etwa Zeitschriftenartikel, Buchbeiträge, Monographien oder Dissertationen) unterscheidet und jeweils die für die vollständige Beschreibung desselben notwendigen Felder definiert. Dieser Ansatz ist bis heute in allen gängigen Systemen zu finden.

Technisch mag BibTeX heute mit seinem proprietären, textbasierten Beschreibungsformat für Literatur-Referenzen antiquiert wirken, es ist jedoch nach wie vor ein gängiges System, dass vor allem in den Naturwissenschaften in Kombination mit LaTeX noch häufig eingesetzt wird. Dementsprechend gibt es auch moderne Produkte, die versuchen, die Verwaltung von Referenzen in BibTeX zugänglicher zu machen. Der Großteil der aktuellen Produkte versucht jedoch, einen moderneren Zugang zu Literaturverwaltung anzubieten und konzentriert sich vor allem darauf, die Verwendung von Referenzen bei der Erstellung von Artikeln in den verschiedensten Textverarbeitungssystemen zu vereinfachen.

Es ist wenig sinnvoll, an dieser Stelle auf konkrete Produkte einzugehen – wichtiger ist es, die grundlegenden Typen zu kennen und deren Vor- und Nachteile abschätzen zu können. Eine Gegenüberstellung konkreter Produkte ist z.B. auf Wikipedia zu finden. Grundsätzlich können wir vier Typen unterscheiden:

  • Stand-Alone-Verwaltungssoftware
  • Online-Dienste
  • Literaturdatenbanken von Textverarbeitungsprogrammen
  • Frontends für Standard-Bibliographie-Formate

Im Folgenden werden wir diese vier Typen kurz näher behandeln und einander gegenüberstellen. Konkrete Systeme sind auch oft Mischformen dieser Typen und weisen Eigenschaften von mehreren Kategorien auf. Zumeist sind sie aber hinsichtlich ihrer Philosophie einen Typ zuzuordnen.

Stand-Alone-Verwaltungssoftware

Stand-Alone-Verwaltungssoftware für wissenschaftliche Literatur ist zumeist desktop-basiert und enthält neben einer Benutzungsschnittstelle zur Literaturverwaltung auch eine Datenbank in der die Metadaten zu den verwalteten Artikeln abgelegt werden. Beispiele für derartige Software sind Produkte wie Endnote, Papers oder Citavi. Der Vorteil dieser Produkte ist die oft bessere Einbettung in das jeweilige Betriebssystem und damit die Möglichkeit der Nutzung von Systemdiensten wie Volltextsuche im Dateisystem abgelegten Metadaten. Mit der steigenden Verbreitung von mobilen Endgeräten steigt auch die Anzahl an für den Betrieb auf Smartphones oder Tablets konzipierten Apps, wobei diese zumeist eher als Companion-Apps konzipiert sind und in Funktionsumfang und Bedienbarkeit nicht an ihre Desktop-Pendants heranreichen. Für die Auswertung verwalteter Literatur sind diese durch integrierte PDF-Bearbeitungswerkzeuge aber oft durchaus geeignet.

Online-Dienste

Seit einigen Jahren existieren Literaturverwaltungen, die versuchen, die Literaturverwaltung näher an die heutzutage gängigsten Datenquellen, die digitalen Bibliotheken, heranzuführen und eine möglichst einfach Integration zu ermöglichen. Während diese System alle eine Online-Komponente beinhalten, unterscheiden sich die Ansätze der Datenextraktion und -verwaltung aber grundlegend. Beispielhaft beschreiben wir kurz drei Vertreter unterschiedlicher Strömungen.

Die Suchmaschine Google Scholar bietet eine integrierte Literaturverwaltung, die zur Verfügung steht, sobald die Suche mit einem aktiven Google Account genutzt wird. Die Funktionalität ist auf die grundlegenden Funktionalitäten beschränkt und ermöglicht im Kern nur das Hinzufügen einer Publikation aus der Suchergebnisliste zu einer privaten Sammlung. Darüber hinaus wird kaum Funktionalität angeboten, vor allem gibt es keine Integration mit Textverarbeitungsprogrammen zur automatisierten Erstellung eines Quellenverzeichnisses.

Zotero ist als Browser-Extension implementiert und führt die gesamte Verwaltung von Literatur im Browser durch. Die Daten werden dabei lokal gespeichert, es gibt zusätzlich eine Online-Platform, auf der Quellen verwaltet und mit Gruppen geteilt werden können. Der Anspruch von Zotero war seit seiner Einführung die möglichst automatisierte Extraktion von Metadaten eines wissenschaftlichen Artikels aus seiner Webseite. Zotero war der erste Dienst, der diesen Ansatz erfolgreich umgesetzt hat und ist hier bis heute führend. Diese Rolle hat sich aber durch die verbesserte Metadatenextraktion der Literatursuchmaschinen relativiert, da die Übertragen von Metadaten über diesen Kanal in andere Literaturverwaltungen nur wenig aufwändiger ist. Zotero bietet Extensions für gängige Textverarbeitungsprogramme und kann so umfassend zur Literaturverwaltung genutzt werden.

Mendeley legt seinem Design einen Social-Media-Zugang zu Verwaltung wissenschaftlicher Literatur zugrunde. Es unterstützt die Erstellung und kollaborative Verwaltung von Literatursammlungen in einer Onlineplattform. Zusätzlich bietet Mendeley einen Offline-Client, mittels dem die Literaturdatenbank auch ohne Internet-Verbindung genutzt werden kann. Die Integration mit Textverarbeitungsprogrammen ist hier inkludiert.

Literaturdatenbanken von Textverarbeitungsprogrammen

Neben Produkten, die explizit das Ziel haben, die Verwaltung von wissenschaftlicher Literatur zu unterstützen, bieten auch Textverarbeitungssysteme wie Microsoft Word oder LibreOffice Funktionen zur Literaturverwaltung an. Die Literatur wird dabei ähnlich wie in Stand-Alone-Produkten erfasst und in einer internen Datenbank des Textverarbeitungssystems abgelegt. Der Fokus liegt in der Folge nicht auf der Auswertung der erfassten Literatur, sondern auf deren Verwendung zur Erstellung eines Quellenverzeichnisses. Da diese Funktionalität inhärenter Bestandteil des Textverarbeitungssystems ist und nicht durch Extensions realisiert werden muss, ist die Integration tendenziell enger und weniger fehleranfällig als bei Stand-Alone-Produkten. Dies wird erkauft mit einer propriäteren Datenhaltung, die nur innerhalb der jeweiligen Textverarbeitung verwendet werden kann und wenig bis keine Export-Möglichkeiten bietet.

Frontends für BibTeX-Dateien

Auch das älteste Literaturverwaltungssystem BibTeX ist vor allem im naturwissenschaftlichen und technischen Bereich noch weit verbreitet, und hat auch unabhängig von LaTeX durchaus sinnvolle Einsatzbereiche. Der größte Vorteil von BibTeX ist die einfach, robuste Speicherung der Literaturdatenbank als Textdatei. Diese wird beim Einsatz in Kombination mit LaTeX auch direkt als Datenquelle verwendet, weswegen kein weiterer Konvertierungsschritt notwendig ist, bei dem Daten verloren oder in unerwarteter Weise abgebildet werden könnten.

Die Verwaltung von BibTeX-Dateien kann durch den Einsatz dedizierter Frontend-Software vereinfacht werden. Diese stellt im Wesentlichen die Funktionalität von Stand-Alone-Software zur Verfügung, greift aber zur Datenhaltung auf eine BibTeX-Datei zurück. Beispiele für derartige Produkte sind JabRef oder BibDesk (letzteres ist ausschließlich für MacOS verfügbar). Beiden Produkten ist gemein, dass sie keine Integration für Textverarbeitungssysteme bieten. Die direkte Verwendung der verwalteten Literatur ist nur in Kombination mit LaTeX möglich.

Literatursuche

Bis vor einigen Jahren nahm die Schulung von Techniken zur Literatursuche und der korrekten Bedienung der beteiligten Werkzeuge und Datenbanken den Großteil einer Schulung in den grundlegenden Techniken des wissenschaftlichen Arbeitens ein. Während sich an der grundlegende Wichtigkeit dieser Werkzeuge nichts geändert hat und auch deren Bedienung nicht wesentlich einfacher geworden ist, hat sich doch der Prozess der Suche mit der Einführung von mächtigen Literatur-Suchmaschinen grundlegend verändert.

Das Ziel dieses Abschnitts ist es einerseits, einen Überblick über den Prozess einer Recherche zu geben, die einen raschen Überblick über ein Thema ermöglicht. Andererseits sollen auch die Werkzeuge vorgestellt werden, die eine tiefgehende, umfassende Literatursuche ermöglichen.

Grundlegende Suchstrategien

Grundsätzlich sind drei verschiedene Suchstrategien zu unterscheiden, die üblicherweise in Kombination angewandt werden.

Eine Stichwortsuche wird mittels einer Suchmaschine durchgeführt, die die angeführten Stichwörter in ihrer Datenbasis sucht und Einträge zurück gibt, die hinsichtlich dieser Stichwörter relevant erscheinen. Sie ist der gängigste Mechanismus, sich in einem Feld zu orientieren und relevante Arbeiten aufzufinden. Einer Stichwortsuche können unterschiedliche Datenbasen und unterschiedliche Suchalgorithmen zu Grunde liegen. Die gängigsten Ausprägungen werden in den folgenden Abschnitten näher beschrieben. Zuvor soll aber noch auf die anderen beiden Strategien eingegangen werden, deren Bedeutung nicht unterschätzt werden darf.

Eine Rückwärtssuche führt man durch, wenn man ausgehend von einer bekannten Literaturquelle in der Vergangenheit nach weiteren relevanten Arbeiten sucht. Dabei geht man vom Quellenverzeichnis der bekannten Arbeit aus. Die Rückwärtssuche beruht auf der Annahme, das wissenschaftliche Arbeiten den jeweils zum Zeitpunkt ihrer Erstellung aktuellen Stand der Forschung aufgreifen und beschreiben. Wie im Abschnitt „Related Work“ beschrieben, ist dies eine wesentliche Komponente einer wissenschaftlichen Arbeit, die zur Beurteilung ihres Beitrags zum Stand der Forschung notwendig ist. Ausgehend von dieser Hypothese kann man in der Liste der Quellen, die in der bekannten Arbeit verwendet werden, nach möglicherweise für die eigene Fragestellung relevanten Arbeiten suchen. Dabei muss die Relevanz dieser weiterführenden Quellen anhand des Titels bzw. in einer ersten Kurzrecherche anhand des Abstracts beurteilt werden. Es ist sinnvoll, die Rückwärtssuche nicht nur über eine Generation durchzuführen, sondern mehrere Schritte in die Vergangenheit zu gehen. Oft können auf diese Weise die für ein Forschungsgebiet grundlegenden Arbeiten identifiziert werden, auf die immer wieder Bezug genommen wird. Diese Art der Suche wird in den letzten Jahren durch die Angabe von DOIs (Digital Object Identifier) im Quellenverzeichnis wesentlich erleichtert. Vielen wissenschaftlichen Artikeln wird von den herausgebenden Verlagen ein eindeutiger DOI zugewiesen. Über einen Resolver-Dienst (https://doi.org) kann mittels dieser DOI auf die Web-Page zugegriffen werden, die diesen Artikel beschreibt (und damit einfachen Zugriff auf den Abstract erlaubt sowie ggf. bei entsprechende Berechtigung auch dessen Volltext zum Download bereitstellt).

Eine Vorwärtssuche ist das Gegenstück zur Rückwärtssuche und dient dementsprechend dazu, nach neueren Artikeln zu einer bekannten Referenzquelle zu suchen. Als Datenbasis dienen dabei die Quellenverzeichnisse von Artikeln, von denen jene als relevant erachtet werden, in denen die Referenzquelle angeführt ist. Es ist naheliegend, dass im Gegensatz zur Rückwärtsuche in diesem Fall technische Unterstützung notwendig ist. Mehrere große Anbieter von Suchmaschinen zu wissenschaftlicher Literatur bieten einen derartigen Dienst an. Üblicherweise wird dies durch einen Link mit einem Titel wie „zitiert von“ bzw. „cited by“ angezeigt, der auf eine Seite verweist, auf der die jeweils auf den Quellartikel bezugnehmenden Arbeiten gelistet sind. Mittels einer Vorwärtssuche kann einerseits erhoben werden, ob zu einem bestimmten Forschungsvorhaben neuere Artikel existieren, als jener der als Referenzquelle dient. Andererseits können so auch die Arbeiten anderer Autoren gefunden werden, die sich ähnlichen Fragestellungen widmen und dabei auf die Referenzquelle als Basis oder verwandte Arbeit Bezug nehmen. Auch hier kann es sinnvoll sein, nicht nur eine Generation in die Zukunft zu suchen, sondern über mehrere Sprünge hinweg soweit in die Zukunft zu suchen, bis keine relevanten Ergebnisse mehr auftreten oder bis man in der Gegenwart angelangt ist.

Eine Kombination aus diesen drei Ansätzen erlaubt es, die Literatur zu einem Thema zu explorieren, relevante Literatur Quellen für die eigene Fragestellung zu identifizieren, und diese in Abgrenzung zum aktuellen Stand der Forschung zu schärfen. Der kritische Punkt in diesem Prozess ist aber der Einstieg. Ohne zumindest eine für die Fragestellung relevante Literaturquelle kann keine Vorwärts- oder Rückwärtssuche stattfinden. Ist diese Quelle noch nicht vorhanden, muss sie mittels einer Stichwortsuche identifiziert werden. Um nicht nur irgendeine vielleicht relevante Quelle zu finden, sondern möglichst gezielt Startpunkte für weiterführende Suchen identifizieren zu können, ist die Wahl des Suchvokabulars ein hochrelevante und gleichzeitig anspruchsvoller Schritt.

Das Suchvokabular – der Schlüssel zum Erfolg

Das Suchvokabukar umfasst jene Stichwörter, mit denen in Literatursuchmaschinen versucht wird, relevante Quellen aufzufinden. Es muss vor Beginn der Suche festgelegt werden, und wird während der Suche ständig weiter entwickelt. Dabei können Stichwörter hinzugefügt, verändert, oder verworfen werden – es ist niemals im Vorfeld abzuschätzen, welche Stichwörter tatsächlich zum Erfolg führen werden.

Der Ausgangspunkt für das Festlegen des Suchvokabulars ist die vollständig ausformulierte Fragestellung der Arbeit. Entfernt man aus dieser Frage-, Binde-, und Füllwörter, so ergibt das einen ersten Ansatzpunkt für die Formulierung des Suchvokabulars. Falls die Fragestellung in Deutsch formuliert wurde, so ist es im naturwissenschaftlich-technischen Bereich sinnvoll, englische Begriffe zu identifizieren und diese als Grundlage der Suche heranzuziehen. Dieser Schritt ist nicht unproblematisch, weil fachspezifisches Vokabular oft nicht eindeutig übersetzbar ist oder mehrere Kandidaten infrage kommen. Hier kann nur mit testweisem Suchen die inhaltlich korrekte Übersetzung identifiziert werden.

Mit Kombination in der identifizierten Begriffe kann nun, wie im nächsten Abschnitt beschrieben, eine erste Suche durchgeführt werden. Führt diese bereits zu relevanten Ergebnissen, kann vorerst mit dem Suchvokabukar weiter gearbeitet werden. Falls keine relevanten Ergebnisse gefunden werden, ist das Suchvokabular entweder falsch gewählt, oder zu spezifisch. In beiden fällen muss versucht werden, ausgehend vom ursprünglichen Suchvokabular allgemeinere, übergeordnete Begriffe zu identifizieren, die das beforschte Feld breiter abdecken und so möglicherweise zu Ansatzpunkten für die Identifikation von Quellen führen, die für das eigentlich gesuchte Thema relevant sind.

Sobald erste relevanten Quellen identifiziert werden konnten, ist es ratsam die bei diesen angeführten Keywords sowie die Abstracts auf möglicherweise relevante weitere Begriffe zu untersuchen und das Suchvokabular entsprechend zu erweitern oder zu modifizieren. Auch Artikel, die im Rahmen einer Rückwärts- oder Vorwärtssuche identifiziert wurden, sollten in die Überarbeitung des Suchvokabulars mit eingehen. Der gesamte Suchprozess ist also iterativ, die unterschiedlichen Suchstrategien müssen im Allgemeinen mehrfach kombiniert durchgeführt werden.

Eine weitere Quelle für möglicherweise relevantes Suchvokabular Sind die verwalteten Schlagwortkataloge von Literaturdatenbanken. Dort werden die in einem Feld relevanten Begriffe gesammelt und zueinander in Beziehung gesetzt. Damit kann über die Begrifflichkeit eines Fachgebiets nach Synonymen, allgemeineren, oder spezifischeren Begriffe durchsucht werden. Die Verwendung dieser Kataloge ist im über nächsten Abschnitt beschrieben.

Literatursuche mittels Suchmaschienen

Die Verfügbarkeit moderner Suchmaschinentechologie für wissenschaftliche Literatur hat den Rechercheprozess grundlegend verändert und einfacher gemacht. Dies gilt vor allem für Fachgebiete, in denen es bereits eine etablierte Kultur der digitalen Publikation von wissenschaftlichen Artikeln gibt – dies ist im für uns relevanten technisch-wissenschaftlichen Bereich der Fall, die Betriebswirtschaft hängt hier wie alle Sozialwissenschaften vor allem bei der Verfügbarkeit historischer Literatur (das heißt mit einem Erscheinungsdatum vor den 1990-Jahren) hinterher.

Suchmaschinen für wissenschaftliche Literatur zeichnen sich dadurch aus, das sie Datenquellen indizieren, die wissenschaftliche Literatur zur Verfügung stellen und sich vor allem auf diese beschränken. Diese Quellen sind vor allem digitale Bibliotheken der Verlage, die wissenschaftliche Literatur veröffentlichen, aber auch Websites, die Literatur katalogisieren oder auf der Forschende ihre Arbeiten in frühen Versionen selbst bereit stellen. Durch die Beschränkung auf wissenschaftliche Literatur können Suchmaschinen zusätzliche Metadaten ausgewerteten und bereits stellen, die dabei helfen, die Relevanz und Qualität der gefundenen Literatur zu beurteilen. Dies inkludiert etwa das Erscheinungsjahr, das Publikationsorgan, die Autoren oder auch wie oft der gegenständliche Artikel in anderen Arbeiten zitiert wurde.

Die verbreitetste Suchmaschine für wissenschaftliche Literatur ist Google Scholar. Ausgestattet mit dem von Google gewohnten einzeiligen Suchinterface ermöglicht sie einen niederschwelligen Einstieg in die Literaturrecherche. Google Scholar indiziert nicht nur eine Vielzahl von Datenbanken und Bibliotheken, es bietet Autoren auch die Möglichkeit, Statistiken über die eigenen Artikel abzurufen und die. Information in Teilen zu warten. Aufgrund der hohen Verbreitung haben die von Google Scholar berechneten Metriken für die Wahrnehmung eines Autors in der wissenschaftlichen Gemeinschaft nicht unbeträchtliche Akzeptanz und Relevanz erhalten. Aufgrund dessen widmen sich viele Autoren der manuellen Wartung ihrer Daten auf Google Scholar, was deren Relevanz weiter erhöht.

Auf Basis der extrahierten Metadaten über wissenschaftliche Publikationen bietet Google Scholar auch einige Funktionen an, die die Arbeit mit gefundener Literatur erleichtern. Zum ersten wird neben einem gefundenen Datensatz ein Link zu einer Volltextversion des Artikels angezeigt, sofern dieser vorhanden ist. Sind mehrere Versionen des Volltextes vorhanden, wird jener angezeigt, der einen kostenfreien Download (etwa über die Website des Autors) ermöglicht. Zum zweiten generiert Google Scholar Datensätze zu den gefundenen Publikationen, die in Literaturverwaltungsprogramme importiert werden können. Das erleichtert die weitere Arbeit mit Literaturquellen wesentlich, wie wir im nächsten Abschnitt sehen werden. Zum dritten bietet Google Scholar eine integrierte Literaturverwaltung, sofern mit einem aktiven Google Konto gesucht wird. Dies ermöglicht nicht nur die einfache Archivierung der gefundenen Artikel, sondern bietet auch eine Funktion, mit der fertig formatierte Literaturreferenzen nach den gängigsten Zitierstandards generiert und mittels Copy/Paste weiter verwendet werden können.

Am Markt gibt es noch weitere Literatur-Suchmaschinen, die nicht an die Datenbasis eines einzelnen Anbieters gebunden sind. In der Tradition klassischer Suchmaschinen steht noch Microsoft Academic Search. Daneben gibt es Anbieter, deren Geschäftsmodell das Anbieten von Suchdiensten zu wissenschaftlicher Literatur ist. Dazu zählen als Bespiele das ISI Web of Knowledge (kostenpflichtig, aber qualitätsgesicherte Quellen) oder der ACM Guide (kostenfrei durchsuchbar, Fokus auf Informatik).

Literaturdatenbanken

Neben Suchmaschinen gibt es weitere Recherchemöglichkeiten, die unabhängig von Verlagen sind und damit nicht von vorne herein auf einen bestimmten Satz an Publikationsmedien beschränkt sind. Literaturdatenbanken sammeln die Referenzen auf wissenschaftliche Literatur eines bestimmten Fachgebiets und katalogisieren diese in einer Form, die einen Mehrwert bei der Suche bietet. Der Zugriff auf Literaturdatenbanken ist üblicherweise kostenpflichtig, was im redaktionellen Aufwand bei der Pflege der Datenbasis begründet liegt. In Literaturdatenbanken wird jeder Artikel von Domänenexperten mit Schlagworten versehen, die ihn auch dann auffindbar machen sollen, wenn weder Titel, Keywords oder Abstract auf eine Relevanz für ein bestimmtes Themenfeld hinweisen würden.

Wichtig ist in diesem Zusammenhang die Unterscheidung zwischen den üblicherweise von den Autoren vergebenen Keywords und Schlagwörtern, die einem von der jeweiligen Literaturdatenbank verwalteten Vokabular entnommen werden und von Personal des Datenbankanbieters zugewiesen werden. Das Vokabular wird in einem Schlagwortkatalog (auch: Thesaurus) verwaltet, in dem es nicht bloß gesammelt, sondern auch untereinander in Beziehung gesetzt wird. So werden zu einem Begriff üblicherweise Synonyme, sowie breitere und engere Begriffe verknüpft und die zeitliche Historie des Begriffs in der Datenbank (z.B. über den Zeitpunkt der Einführung) angegeben. Der Schlagwortkatalog wird nicht unreflektiert erweitert oder verändert und unterliegt üblicherweise einer redaktionellen Verwaltung.

Mittels Schlagwortsuche können nicht nur Artikel aufgefunden werden, deren Relevanz für ein Thema nicht aus dessen sonstigen Metadaten ersichtlich ist, der Schlagwortkatalog kann auch dazu verwendet werden, das Vokabular eines Forschungsgebiets zu explorieren und so das eigene Suchvokabular zu schärfen.

Zusätzlich bieten Literaturdatenbanken üblicherweise mächtigere Suchmöglichkeiten als die oben beschriebenen Suchmaschinen. So kann die Suche explizit auf einzelne Felder der Metadaten eingeschränkt werden (etwa auf Suche nach Autorennamen, Suche in Titeln, Suche nach bestimmen Erscheinungsjahren, …). Suchelemente können auch beliebig mittels logischer Operatoren miteinander kombiniert werden, so dass komplexe Datenbankabfragen möglich werden. Möchte man zum Beispiel nach den Artikeln suchen, die von Stefan Oppl in den Jahren 2012 bis 2015 geschrieben hat und deren Titel die Worte “Articulation” oder “Elicitation” enthalten, so könnte (abhängig von der Datenbank) eine Suchanfrage etwa so aussehen:

AU="Oppl" and YEAR>=2012 and YEAR<=2015 and (TI="*Articulation*" or TI="*Elicitation*)

Literaturdatenbanken sind in der Informatik eher selten anzutreffen, habe aber große Bedeutung in anderen Disziplinen wie der Psychology (z.B. PsycInfo), der Soziologie (z.B. SocIndex), den Wirtschaftswissenschaften (z.B. EconLit) oder den Naturwissenschaften (z.B. INSPEC).

Beurteilung der Relevanz von Literaturquellen

Unabhängig davon, auf welchem Weg Literatur gesucht wurde, muss für die gefundenen Ergebnisse deren Relevanz für die jeweilige Fragestellung bewertet werden. Nur so kann sichergestellt werden, dass in der weiteren Bearbeitung der Fragestellung effektiv (im Sinne der Beiträge der identifizierten Literatur zur Beantwortung der Fragestellung) und effizient (im Sinne des Aufwandes zur detaillierten Auswertung der tatsächlich relevanten Artikel) vorgegangen werden kann.

Die Beurteilung der Relevanz eines Artikels wird üblicherweise mehrstufig durchgeführt. Diese Stufen orientieren sich an den verfügbaren Informationsmengen der jeweiligen Darstellungsform der Artikel im Prozess der Suche.

Im ersten Schritt wird eine Vorauswahl in der Ergebnisliste der Literatursuche getroffen. Dabei sind im Normalfall der Titel des Artikels, die Namen der Autoren, das Erscheinungsjahr, sowie u.U. das Publikationsorgan sichtbar. Auf Basis dieser Information muss eine Vorauswahl getroffen werden, die sich vor allem am Titel und – sofern ein gewisser Überblick über das Forschungsfelder gegeben ist – an den Autoren orientieren wird. In dieser Stufe werden Artikel im Zweifel eher nicht verworfen sondern weiter untersucht.

Im zweiten Schritt wird in der Detailansicht der jeweiligen Artikel deren Relevanz anhand der dort üblicherweise verfügbaren Keywords und Abstracts beurteilt. Anhand des Abstracts kann die potentielle Relevanz eines Artikels bereits gut eingeschätzt werden, wenn er hinsichtlich möglicher Beiträge zur Beantwortung der Fragestellung untersucht wird.

Ob ein Artikel für eine bestimmte Fragestellung tatsächlich relevant ist, kann erst im dritten Schritt bei der Auswertung des vollständigen Textes beurteilt werden. Da dies aufwändig ist und u.U. auch Kosten verursacht, müssen die so untersuchten Artikel im vorhergehenden Schritt sorgfältig ausgewählt werden. Die strukturierte Auswertung anhand der Fragestellung der als relevant identifizierten Artikel wird Abschnitt „Exzerpieren“ näher behandelt.

Dokumentation der Suche

Wie bereits mehrfach erwähnt, ist die Nachvollziehbarkeit des Erkenntnisprozesses eine wesentliches Qualitätsmerkmal für wissenschaftliche Artikel. Bei Arbeiten, deren Beitrag in der Aufarbeitung und der strukturierten Gegenüberstellung des Standes der Forschung liegt, ist die Dokumentation des Suchprozesses deshalb ein wichtiger Bestandteil. Im Artikel selbst ist dieser zumeist kompakt beschrieben, um diese Beschreibung aber korrekt erstellen zu können, ist es sinnvoll, des Suchprozess während seiner Durchführung zu protokollieren. Dies beschränkt sich nicht nur auf die gefundenen Ergebnisse, sondern solle folgende Information umfassen:

Als erste Komponente sollte das Suchvokabular dokumentiert werden. Dabei sollte dessen Evolution nachvollziehbar dokumentiert werden, idealerweise unter Angabe der Gründe der jeweiligen Modifikation.

Die zweite Komponente führt die verwendeten Suchmaschinen und Datenbanken an und gibt zu jeder die dort durchgeführten Suchen an. Diese werden üblicherweise tabellarisch angeführt, wobei jede Tabellenzeile den jeweils verwendeten Suchtext (d.h. die verwendete Kombination aus Suchbegriffen), die Anzahl der gefundenen Ergebnisse, sowie die Anzahl der initial als relevant erachteten Artikel anführt.

Die dritte Komponente führt die vollständigen Referenzdaten der im zweiten Schritt der Relevanzprüfung gewählten Artikel an. Zusätzlich wird der Abstract dokumentiert, ein Verweis auf den Suchvorgang, in dem der Artikel gefunden wurde, hinzugefügt und eine kurze Begründung der Auswahl angegeben (in 1-2 Sätzen).

Auf dieser Basis kann die identifizierte Literatur weiter bearbeitet werden, ohne dass Information über den Suchprozess verloren gehen kann. In Kombination mit dem Einsatz einer Software zur Literaturverwaltung ist damit die Grundlage für die erfolgreiche Aufarbeitung der identifizierten Quellen im Rahmen der wissenschaftlichen Arbeit gelegt.

Volltexte beziehen

Bislang haben wir ausschließlich die Suche von Literaturquellen behandelt, den Bezug der eigentlichen Arbeiten aber weitgehend ausgespart oder stillschweigend vorausgesetzt. Tatsächlich stellt aber der Bezug der Volltexte – egal ob in digitaler oder gedruckter Form – oft eine Herausforderung dar, die nicht unwesentliche organisatorische oder finanzielle Hürden mit sich bringt. Falls der Volltext nicht zufällig beim Einsatz einer Suchmaschine wie Google Scholar verlinkt ist (was in der Wirtschaftsinformatik und Informatik oft der Fall ist), muss der Volltext auf andere Weise bezogen werden. Die gängigsten Quellen dafür werden im Folgenden beschrieben.

Digitale Bibliotheken

Sollte der Volltext nicht direkt über eine Verlinkung beim Suchergebnis beziehbar sein, kann von dort aus üblicherweise auf die Webseite des Artikels in der digitalen Bibliothek des veröffentlichenden Verlags zugegriffen werden. Oft ist dort eine PDF-Version des Artikels beziehbar, grundsätzlich ist dies aber kostenpflichtig.

Universitätsbibliotheken schließen mit Verlagen deshalb oft Abo-Verträge ab, die den an der jeweiligen Institution tätigen Personen Zugriff auf die Volltexte der digitalen Bibliotheken oder Teilen davon gewähren. Die Identifikation erfolgt dabei oft über die IP-Adresse, so dass ein Zugriff aus dem Campus-Netzwerk notwendig ist. Teilweise werden auch Proxy-Dienste oder externe Authentifizierungsmechanismen genutzt, die einen Zugriff mittels Login auch von außerhalb des Campus-Netzwerks ermöglichen. Details sind üblicherweise auf der Website der jeweiligen Universitätsbibliothek zu finden.

Bestandskataloge

Falls eine digitale Version eines Artikels oder eines Buches nicht verfügbar oder nur kostenpflichtig beziehbar ist, ist es sinnvoll, nach dessen Verfügbarkeit in gedruckter Form zu suchen. Die wesentliche Quelle dafür sind Universitätsbibliotheken. Diese sammeln wissenschaftliche Literatur und stellen diese den Hochschulangehörigen zur Ansicht oder zur Leihe zur Verfügung. Welche Literatur an einer bestimmten Universität vorhanden ist, ist in deren Bestandskatalog verzeichnet, der heute üblicherweise in digitaler Form vorliegt.

Die Suche im Bestandskatalog unterscheidet sich nicht wesentlich von jener in Literaturdatenbanken. Zu beachten ist lediglich, dass bei wissenschaftlichen Artikeln nicht nach deren Titel, sondern nach dem Publikationsorgan gesucht werden muss, in dem der Artikel erschienen ist. Bei einem Zeitschriftenartikel ist also beispielsweise nach dem Titel der Zeitschrift in Kombination mit dem jeweiligen Jahrgang (Volume) und Ausgabe (Number) zu suchen.

Die zu einer Publikation verfügbaren Daten unterscheiden sich jedoch wesentlich von jenen in einer Literaturdatenbank. Zu jeder Publikation ist vorrangig angeführt, wo diese örtlich verfügbar ist. Dafür gibt es im Allgemeinen drei Parameter. Der Standort gibt an, in welcher Teilbibliothek die Publikation verfügbar ist. Universitätsbibliothek besitzen üblicherweise mehrere Außenstellen, an denen Fachliteratur für die Disziplinen der in der Nähe befindlichen Organisationseinheiten verwaltet werden. Der Standort führt an, an welcher Außenstelle oder in welchen Bereich der jeweiligen Hauptbibliothek eine Publikation verfügbar ist. Die Systematik einer Publikation dient deren Lokalisierung innerhalb eines Standortes. Die Systematik ist üblicherweise eine Zahlenkombination, die auf ein Regal oder Teil davon verweist. Dazu existiert üblicherweise ein Übersichtsplan, außerdem sind die in einem Regal aufgestellten Systematiken an deren Stirnseiten angeführt. Sobald das korrekte Regal gefunden wurde kommt die Signatur zum Einsatz. Die Signatur ist die Buchstaben- und Zahlenkombination, die am Buchrücken angebracht ist und die jeweilige Publikation eindeutig identifiziert. Im Fall von Zeitschriften ist üblicherweise ein kompletter Jahrgang unter einer Signatur zusammengefasst, der jeweilige Artikel muss dann noch in der Publikation gesucht werden.

Falls eine Publikation an einem Standort nicht verfügbar ist, kann in den Katalogen von Bibliotheksverbünden gesucht werden. Diese Kataloge enthalten die Bestände aller angeschlossenen Bibliotheken. Für Österreich gibt es z.B. die Verbundkataloge, der die Bestände der Bibliotheken aller österreichischen Universitäten enthält. Innerhalb eines Bibliotheksverbundes ist üblicherweise eine Fernleihe möglich. Dabei kann eine Publikation, die in einer anderen Bibliothek verfügbar ist, kostenfrei oder gegen ein geringes Entgelt angefordert werden. Der Versand erfolgt postalisch an die Heimatbibliothek, die dann die Ausleihe vornimmt oder die Publikation zur Einsichtnahme zur Verfügung stellt.

Als weitere Alternative bietet sich die Nutzung von Dokumentenlieferdiensten an. Auch diese ermöglichen den Zugriff auf den Bestand entfernter Bibliotheken, wobei das abgedeckt geographische Gebiet üblicherweise weiter gestreut ist als bei Bibliotheksverbünden. Die Lieferung erfolgt im Falle eines Dokumentenlieferdienstes nicht als Gesamtpublikation im Original, sondern als Kopie des jeweils angeforderten Artikels oder Buchkapitels. Die Auslieferung erfolgt als physische oder digitale Kopie, wobei ein Entgelt für deren Anfertigung und den Versand zu entrichten ist. Ein Beispiel für einen Dokumentenlieferdienst ist Subito, an das Bibliotheken im gesamten deutschsprachigen Raum angeschlossen sind.

Der Vollständigkeit halber sei angeführt, dass die Suche in einem Bestandskatalog eine umfassende Literaturrecherche nicht ersetzen kann. Der Bestandskatalog enthält immer nur die an einem Standort verfügbare Literatur und wird deshalb im Allgemeinen nie zu umfassenden Ergebnissen führen.

Andere Bezugsquellen für Volltexte

Durch die Möglichkeit, als Forschender im WWW auch eigenständig Inhalte zu veröffentlichen, haben sich neben den digitalen Bibliotheken der Verlage noch weitere Möglichkeiten etabliert, die Volltexte von Artikeln zu beziehen. Über einige gängige Wege soll hier noch abschließend ein Überblick gegeben werden. Vorausschickend ist wichtig zu verstehen, dass Autoren im Zuge der Veröffentlichung eines Artikels üblicherweise ihr Copyright an den jeweiligen Verlag abtreten. Damit verlieren Sie die Publikationsrechte am eigenen Artikel und dürfen diesen nur bei Duldung durch den Verlag zugänglich machen. Die jeweiligen Regelungen unterscheiden sich stark zwischen den Verlagen und sind nicht immer einfach zu durchdringen (siehe dazu auch die RoMEO-Datenbank, die die Richtlinien von Zeitschriften sammelt und aufbereitet). Aus Konsumentensicht ist wichtig, dass oft nicht die finale Version des Artikels veröffentlicht werden darf. Autoren dürfen aber üblicherweise frühere Versionen online stellen, die sich manchmal nur durch die Formatierung von der finalen Version unterschieden, manchmal aber auch noch die Version vor der Einarbeitung der Gutachterkommentare darstellen. Es ist also nicht garantiert, dass bei der Verwendung einer derartigen Version tatsächlich auf die endgültigen Formulierungen Bezug genommen wird.

Der gängigste Weg, eine Publikation online zur Verfügung zu stellen, ist das sogenannte Self-Archival. Darunter versteht man das Veröffentlichen eines Artikels auf einer eigenen Website, in institutionellen Repositories (d.h. in Ablagesystemen von Universitäten oder Fördergebern) oder auf Websites von Drittanbietern, die sich der Sammlung wissenschaftlicher Literatur verschrieben haben (Beispiele hierfür sind CiteSeer, Academia.edu oder ResearchGate). Literatursuchmaschinen wie Google Scholar greifen auf derartige Quellen zu, um die Volltexte eines Artikels direkt zu den Suchergebnissen zu verlinken.

In vielen wissenschaftlichen Disziplinen, vor allem in den Naturwissenschaften, haben sich sogenannte Preprint-Repositories etabliert, auf denen wissenschaftliche Artikel bereits in frühen Versionen veröffentlicht werden, um der wissenschaftlichen Community rasch Zugriff auf neue Erkenntnisse zu ermöglichen und gleichzeitig deren Feedback noch außerhalb des klassischen Review-Prozesses einzuholen. Es ist üblich, dass mehrere Versionen eines Artikels auf dem Preprint-Server bereit gestellt werden, bevor er zur traditionellen Publikation bei einer Zeitschrift eingereicht wird, wo er den üblichen Begutachtungsprozess durchläuft. Die Vorversionen bleiben aber verfügbar und sind üblicherweise mit der endgültig publizierten Version, so bereits verfügbar, verknüpft. Das etablierteste Preprint-Repository ist Arxiv, in dem vor allem naturwissenschaftliche und technische Artikel bereitgestellt werden.

Als letzter Weg zum Bezug eines Artikels bietet sich die direkte Anfrage bei den Autoren mit der Bitte um Übermittlung einer (digitalen) Kopie des Artikels an. Dies ist durchaus üblich und verletzt aufgrund der gezielten Übermittlung auch nicht das Copyright des veröffentlichenden Verlages. Aufgrund der allgegenwärtigen eMail-Flut sind längere Reaktionszeiten oder die Ignoranz einer Anfrage allerdings nicht selten. In den letzten Jahren haben sich auch soziale Netzwerke für WissenschafterInnen etabliert, in denen üblicherweise ebenfalls Anfragen nach Volltexten von Artikeln abgesetzt werden können, und über die auch die Beantwortung derartiger Anfragen einfach abgewickelt werden kann. Beispiele für für derartige Netzwerke sind ResearchGate und Academia.edu.

Finden einer Fragestellung

Eine konkret ausformulierte Fragestellung ist der Schlüssel zu einem nachvollziehbaren, in sich geschlossenen, wissenschaftlichen Artikel. Wenn die Fragestellung nicht klar festgelegt ist, ist es annähernd unvermeidlich, dass die Arbeit aus untereinander unverbundenen Textblöcken besteht, deren Relevanz nicht klar ist und die keinerlei Motivation für Lesende bieten, den Inhalten irgendeine Bedeutung zuzuweisen.

Auch wenn eine Fragestellung festgelegt wurde, kann diese ungeeignet für die jeweilige Art der wissenschaftlichen Arbeit sein. Zum einen kann der Betrachtungsbereich der Arbeit zu breit gewählt sein, so dass der Rahmen der Arbeit bei umfassender Bearbeitung gesprengt wird und sie nur schwer nachvollziehbar ist. Zumeist führt eine zu breite Fragestellung aber zu oberflächlichen Arbeiten, die die Fragestellung nur unbefriedigend beantworten. Im Gegensatz dazu kann der Betrachtungsbereich auch zu eng gewählt sein, so dass der einer wissenschaftlichen Arbeit innewohnende systematische Charakter der Darstellung früherer Arbeiten, die sich ähnlichen Fragestellungen gewidmet haben, nicht gewährleistet werden kann. Zum dritten kann die Perspektive, aus der die Fragestellung formuliert ist, ungünstig gewählt sein. Dies führt unter Umständen dazu, dass für die Beantwortung der Forschungsfrage die Anwendung von Methoden notwendig ist, in denen der Forschende nicht geübt ist (etwa bei speziellen empirischen Untersuchungsmethoden). Im Extremfall kann eine Fragestellung sogar nicht beantwortbar sein, etwa wenn dazu Daten aus nicht beobachtbaren Quellen notwendig wären. In diesem Fall ist der einzige Ausweg eine Um- oder Neuformulierung der Fragestellung.

Die bewusste Annäherung an und konkrete Formulierung einer Fragestellung ist deshalb ein notwendiger erster Schritt bei der Durchführung einer wissenschaftlichen Arbeit. Die im folgenden vorgeschlagene Vorgehensweise kann vor allem bei den ersten Annäherungen an das wissenschaftliche Arbeiten hilfreich sein. Es ist an die in dem Buch „The Craft of Research“ (Booth et al., 2003) vorgeschlagene Vorgehensweise angelehnt und mit eigenen Erfahrungen angereichert. Weiterführende Erklärungen und Beispiele sind in Kapitel 3 und 4 des angeführten Buchs zu finden.

Ein Thema finden

In vielen Seminaren, die Studierende im Rahmen ihres Curriculums absolvieren müssen, werden konkrete Themenstellungen vorgegeben. Während dies die Bearbeitung vereinfacht, da im Idealfall sowohl die Breite des Themas bewusst gewählt ist als auch dessen Relevanz gegeben ist, nimmt diese Vorgehensweise den Teilnehmenden die Möglichkeit, den ersten wesentlichen Schritt des wissenschaftlichen Arbeitens selbstständig zu gehen.

Forschung beginnt immer mit der Wahl eines Themas, das beforscht werden soll. Wenn man als ForschendeR in der Position ist, dieses Thema selbst zu wählen, sollte dies von persönlichem Interesse und Neugier getrieben sein. Es gibt kein Thema, dass nicht wissenschaftlich bearbeitet werden kann – die Kunst liegt darin, nach der Wahl des grundlegenden Gebiets in die Tiefe zu gehen und einen Aspekt zu identifizieren, in dem eine Wissenslücke klafft und diese begründbar zu benennen. Dazu werden wir aber erst im übernächsten Schritt kommen.

Ein mögliches Thema ist – wie bereits erwähnt – alles, was das persönliche Interesse weckt. Im konkreten Fall des Proseminars soll dieses Thema noch mit sozio-technischen Kommunikationssystemen im allgemeinsten Sinn zu tun haben. Ein konkretes Bespiel, an dem wir uns in der Folge immer wieder orientieren werden, wäre etwa das Thema

„sicheres Instant Messaging”

Während dieses Thema bereits so konkret ist, dass klar entschieden werden kann, welche Inhalte aus dem breiteren Themenbereich der

„technologievermittelten synchronen Kommunikation“

potentiell relevant sind, ist dennoch noch unklar, was in diesem Thema genau von Interesse ist. Das gesamte Thema erschöpfend zu bearbeiten, ist im Rahmen der Proseminararbeit nicht möglich und würde wohl sogar für eine Dissertation zu weit führen. Auch ist es noch nicht möglich, eine konkrete Frage zu stellen, die man beantworten möchte. Dazu ist es notwendig, das Thema weiter eingrenzen.

Das Thema eingrenzen

Es ist ein generell beobachtbares Phänomen, dass Themen im Allgemeinen eher zu breit als zu eng gewählt werden. Wie bereits beschrieben, führt dies zumeist zu oberflächlichen Arbeiten, denen eine unfokussierte Fragestellung zu Grunde liegt. Um zu einer möglichst konkreten Fragestellung zu kommen, muss deshalb das gewählte Thema weiter eingegrenzt werden. Dies kann auf mehrere Arten erfolgen. Wir unterscheiden hier zwei grundlegende Strategien, die zumeist in Kombination zur Anwendung kommen.

Zum einen kann das Thema eingegrenzt werden, indem auf eine inhaltliche Teilmenge des gewählten Feldes fokussiert wird. Dies bedeutet, dass der Umfang des Untersuchungsgegenstandes der wissenschaftlichen Arbeit reduziert wird. Dies lässt sich am oben eingeführten Beispiel gut illustrieren. Den Ausgangspunkt bildet das Thema „sicheres Instant Messaging”. Eine inhaltliche Teilmenge davon wäre etwa

„sichere Kommunikation der Instant Messaging Produkte X und Y im Vergleich“.

Dabei grenzen wir das allgemeine Konzept, das im ersten Thema angesprochen wurde, auf den Vergleich zweier konkreter Produkte ein. Eine andere Möglichkeit zur Eingrenzung im konkreten Beispiel wäre, den Begriff der „Sicherheit“ exakter zu fassen und auf einen Teilaspekt zu fokussieren. Damit wären etwa Themen wie

„abhörsicheres Instant Messaging“

oder

„authentifiziertes Instant Messaging“

denkbar, da sowohl Abhörsicherheit als auch Authentifizierung Teilaspekte von Sicherheit im Allgemeinen darstellen.

Zum anderen kann ein Thema eingegrenzt werden, indem auf einen konkreten Aspekt des Themas fokussiert wird, den man grundsätzlich auch bei einem anderen Thema betrachten könnte. Das Finden eines derartigen „Querschnittsthemas“ ist ein sehr effektiver Weg zur Eingrenzung. Das Querschnittsthema ist im Allgemeinen unabhängig von dem ursprünglich gewählten Thema, und stellt eine Perspektive auf dieses dar, auf die fokussiert wird, während andere Teilaspekte ausgeblendet werden. In unserem konkreten Beispiel könnte ein derartiges Querschnittsthema die Benutzbarkeit von Softwareprodukten sein, wodurch sich als Thema

„Benutzbarkeit von sicherem Instant Messaging“

ergeben würde. Ein anderes Querschnittsthema könnten Signaturalgorithmen sein, wodurch sich ein Thema wie

„Signaturmechanismen zur Realisierung sicheren Instant Messagings“

ergeben würde. Es ist klar ersichtlich, dass beide Beispiele unterschiedliche Teilaspekte des ursprünglichen Themas abdecken und zu einer klaren Fokussierung führen.

In der Kombination beider Eingrenzungstratgien liegt zumeist der Schlüssel zu einem Thema, zudem eine konkrete, bearbeitbare Fragestellung formuliert werden kann. In unserem Beispiel könnte eine Kombination zu einem Thema führen, das folgendermaßen beschrieben werden kann:

„Benutzbarkeit von Authentifizierungsmethoden in sicherem Instant Messaging am Beispiel von Produkt X und Produkt Y“

Hier kamen sämtliche oben angeführte Eingrenzungsmechanismen zu tragen. Während das ursprüngliche Themengebiet unverändert blieb, fokussiert die Einschränkung auf Authentifizierungsmethoden auf ein konkretes Teilgebiet, dass durch die Nennung konkreter Produkte zusätzlich auf bestimmte Beobachtungsgegenstände fokussiert wird. In diesem fokussierten Themengebiet wird zusätzlich noch der Teilaspekt der Benutzbarkeit herausgegriffen, wodurch die Perspektive auf die Beobachtungsgegenstände, die in der Arbeit eingenommen wird, festgelegt und klar abgegrenzt wird. Auf dieser Basis kann nun versucht werden, den aktuellen Stand der Forschung mit vertretbarem Aufwand zu erheben und eine bearbeitbare Fragestellung zu formulieren.

Eine Fragestellung festlegen

Nachdem wir nun unser Themengebiet festgelegt und eingegrenzt haben, können wir nun eine Fragestellung formulieren, die in der wissenschaftlichen Arbeit konkret beantwortet werden soll. Während das Thema beschreibt, in welchem Gebiet wir uns bewegen, soll die Fragestellung „den Finger in die Wunde legen“ und konkret benennen, wo dem aktuellen Stand der Forschung eine Wissenslücke klafft, die beantwortet werden soll. In diesem Sinn konkretisiert also die Fragestellung das Thema nochmals, und erlaubt es in weiterer Folge, eine Untersuchungsmethodik festzulegen, mithilfe derer die Frage beantwortet werden kann.

Wenn wir erneut auf unser Beispiel zurückgreifen, so war das eingegrenzte Thema „Benutzbarkeit von Authentifizierungsmethoden in sicherem Instant Messaging am Beispiel von Produkt X und Produkt Y“. Fragestellungen können nun am einfachsten durch Umformulierung unter Hinzufügung von Fragewörtern erzeugt werden. Je nachdem, welches Fragewort verwendet wird, ergeben sich unterschiedliche Fragestellungen, die in der Folge unterschiedliche Vorgehensweisen bei der Bearbeitung des Themas bedingen.

„Wie unterscheidet sich die Benutzbarkeit der Authentifizierung von Benutzern bei der Verwendung der sicheren Instant Messaging Systeme X und Y?“

wäre etwa eine Fragestellung, die durch Fokussierung auf die konkreten Unterschiede der beiden betrachteten Systeme zu Stande käme. Würde man abstrakter auf die Möglichkeiten zur Beurteilung der Benutzbarkeit von Authentifizierungsmechanismen eingehen wollen, könnte man fragen

„Welche Möglichkeiten zur Beurteilung der Benutzbarkeit von Authentifizierungsmechanismen in sicheren Instant Messaging Systemen wie X und Y gibt es?“.

Im Gegensatz dazu könnte man die erste Frage auch folgendermaßen fassen:

„Ist der Authentifizierungsmechanismus des sicheren Instant Messenger X oder jener von Y besser benutzbar?”

Alle drei nun formulierten Fragen bewegen sich im eingegrenzten Themengebiet, sprechen aber vollkommen unterschiedliche Aspekte an und müssen unterschiedlich bearbeitet werden. Um die Implikationen der unterschiedlichen Formulierungen zu illustrieren, skizzieren wir im Folgenden jeweils einen möglichen Bearbeitungswege für jede Frage.

Die erste Frage fokussiert auf den Vergleich einer Eigenschaft (Benutzbarkeit des Authentifizierungsmechanismus) zweier Instanzen (Produkt X und Y) der gleichen Systemklasse (sichere Instant Messenger). Zur Beantwortung dieser Frage müsste man die Kriterien, anhand derer der Vergleich durchgeführt werden kann, festlegen. Um dies nachvollziehbar zu machen, müssen diese Kriterien auf Basis existierender Arbeiten im Feld der Benutzbarkeitsforschung abgeleitet werden. Danach müsste der Authentifizierungsmechanismus beider Systeme beschrieben werden und in der Folge anhand der Kriterien beurteilt und verglichen werden. Falls sich nicht jedes Kriterium rein durch Betrachtung des Mechanismus beurteilen ließe, müssten ggf. Benutzertests durchgeführt werden. Das Ergebnis einer derartigen Arbeit wäre ein strukturierter Vergleich der betrachteten Systeme anhand von begründbaren Kriterien.

Die zweite Frage ist abstrakter gelagert und zielt darauf auf, methodische Zugänge zur Untersuchung (Möglichkeiten zur Beurteilung der Benutzbarkeit) eines Phänomens (Authentifizierungsmechanismen in sicheren Instant Messaging Systemen) zu erörtern. Die konkreten Systeme rutschen hier in den Hintergrund und dienen dazu, die Klasse der untersuchten Systeme beispielhaft zu fassen. Die Beantwortung dieser Frage bedingt eine umfassende Auseinandersetzung mit früheren Arbeiten im Bereich der Beurteilung der Benutzbarkeit von IT-Systemen. Diese müssen systematisch beschrieben und hinsichtlich ihrer Eignung für die Untersuchung des Authentifizierungsmechanismus von sicheren Instant Messengern beurteilt werden. Dazu müssen die relevanten Charakteristika dieser Systeme identifiziert werden, welche – falls vorhanden – aus existierenden Arbeiten abgeleitet werden können, oder – alternativ – die durch die Untersuchung konkreter Systeme (wie Produkt X oder Y) gewonnen werden können. Das Ergebnis einer derartigen Arbeit wäre eine systematische Darstellung der untersuchbaren Eigenschaften und der jeweils möglichen methodischen Zugänge dazu.

Obwohl die dritte Frage am konkretesten und am einfachsten bearbeitbar erscheint, ist sie doch am schwierigsten gelagert. Dies liegt vor allem in der Verwendung des Wortes „besser“ begründet, das zur Beantwortung dieser Frage operationalisiert werden muss, d.h. mit konkret messbare Kriterien hinterlegt werden muss, deren Ausprägungen begründbar eine höhere oder niedrigere Benutzbarkeit eines Systems anzeigen. Um diese Operationalisierung durchzuführen, muss, falls nicht auf ein konkretes Messsystem aus früheren Arbeiten zurückgegriffen werden kann, im wesentlichen die gesamte zweite Fragestellung bearbeitet werden, bevor auf die konkret untersuchten Produkte eingegangen werden kann. Diese müssen dann, ähnlich der ersten Fragestellung, beurteilt werden, wobei eine rein beschreibende Gegenüberstellung nicht mehr ausreicht, da ja eine Rangordnung erstellt werden soll. Es müssen deshalb Messungen durchgeführt werden, die eine derartige quantitative oder qualitative Einordnung der untersuchten Produkte ermöglicht. Dabei muss beachtet werden, dass „besser“ in der Fragestellung nicht eingeschränkt wurde, so dass die Untersuchungen den Ansprüchen an eine Allgemeingültigkeit der getroffenen Aussagen genügen müssen. Das Ergebnis dieser Arbeit wäre eine begründete Aussage darüber, welcher Authentifizierungsmechanismus der beiden betrachteten Systeme besser benutzbar ist.

Diese drei Beispiele sollen illustrieren, dass die Wahl der Fragestellung für deren Bearbeitbarkeit unter gegeben Rahmenbedingungen (verfügbare Zeit, Umfang, Vorkenntnisse) hoch relevant ist. Die Bearbeitbarkeit einer Fragestellung hängt auch davon ab, wieviele der notwendigen Teilfragen bereits in früheren Arbeiten (ggf. anderer Forscher) beantwortet wurden. Im Gegenzug ist es aber auch notwendig darzustellen, wo die eigene Arbeit über jene Antworten hinaus geht, die bereits in früheren Arbeiten gegeben wurden. Erst eine derartige Einordnung begründet die (wissenschaftliche) Relevanz einer Fragestellung.

Die Relevanz der Fragestellung begründen

Mit der Begründung der Relevanz der Fragestellung muss dargelegt werden, warum die Zielgruppe der Arbeit (im Normalfall ein wissenschaftliches Fachpublikum) diese lesen sollte, bzw. welchen Mehrwert sie daraus generieren kann. Da Mehrwert in der Wissenschaft dadurch entsteht, dass Erkenntnisse so nachvollziehbar und begründet dargestellt werden, dass andere Forscher darauf aufbauen können und nicht die gleiche Frage nochmals beantworten müssen.

Deshalb wird die Relevanz durch Abgrenzung zum aktuellen Stand der Forschung begründet. Dies bedingt eine Literaturrecherche, die wir später noch im Detail behandeln werden. In der Darstellung der Fragestellung zeigt sich die Begründung der Relevanz im Normalfall durch eine Argumentionskette, in der auf frühere Arbeiten verwiesen wird. Diese Argumentationskette hat das Ziel, die Relevanz des Themengebiets zu zeigen, danach zum eingegrenzten Thema hinzuführen, in diesem Thema eine bislang in der Forschung nicht beantwortete Frage zu identifizieren und daraus die Zielsetzung der Arbeit abzuleiten.

In unserem Beispiel betrachten wir die erste oben angeführte Fragestellung. Die Relevanz wird hier hypothetisch erörtert, da die dazu notwendige Literaturrecherche nicht umfassend dargestellt werden kann. Im ersten Schritt würde die Relevanz des Themenfelds der sicheren Kommunikation mittels Instant Messengern begründet werden. Diese Begründung wird oft aus konkreten, aktuellen Anlassfällen bezogen, hier könnte das die allgegenwärtige Überwachung von Kommunikation durch Geheimdienste sein. Im nächsten Schritt würde man zur Relevanz der Authentifizierung der Kommunikationspartner überleiten. Diese würde sich einerseits durch konzeptuelle Erwägungen zu den relevanten Aspekten sicherer Kommunikation begründen lassen, andererseits auch durch konkrete Attacken, wie Man-in-the-Middle -Angriffen, die durch adäquate Authentifizierungsmechanismen verhindert werden können. Danach würde man zeigen, dass es existierende Mechanismen gibt, mit denen eine Authentifizierung technisch bzw. organisatorisch realisiert werden kann, die aber in der Praxis keine weite Verbreitung gefunden haben. Den Grund für die mangelnde Verbreitung würde man in der mangelhaften Benutzbarkeit der eingesetzten Systeme verorten. Diese Behauptung ist die Relevanz der Fragestellung zentral und muss entsprechend mit Erkenntnissen aus früheren Arbeiten abgesichert werden. Im nächsten Schritt würde man zeigen, dass zum aktuellen Stand der Forschung noch keine systematische Darstellung der relevanten Aspekte der Benutzbarkeit eines Authentifizierungsmechanismus bei Instant Messengern existiert und deshalb als erster Schritt in diese Richtung eine Gegenüberstellung der Eigenschaften der weit verbreiteten Systeme X und Y erfolgen soll, um die Relevanz von in der Literatur über Benutzbarkeit von IT-Systemen vorgeschlagenen Kriterien für den Anwendungsfall beurteilen zu können.

Der kritische Punkt in dieser Argumentationskette ist, wie erwähnt, die Begründung der geringen Verbreitung von Authentifizierungsmechanismen auf ihre mangelhafte Benutzbarkeit. Wenn dieser nicht mit entsprechenden Literaturquellen hinterlegt werden kann, weißt dies darauf hin, dass diese Hypothese selbst untersucht und belegt werden muss. Dies kann zwar wiederum auf Basis des gleichen Themas geschehen, würde aber eine andere Fragestellung bedingen. Diese zu formulieren bleibt der Leserin bzw. dem Leser überlassen, eine mögliche Formulierung ist in der Fußnote angeführt1.

Hilfe zu Selbstkontrolle einer Fragestellung

Die Identifikation eines Themas, das Formulieren einer Fragestellung, sowie die Begründung der Relevanz ist gelungen, wenn der folgende Satz vervollständigt werden kann:

„Ich möchte X untersuchen, um herauszufinden ob Y, damit meine LeserInnen verstehen, dass Z“.

X ist hier der identifizierte eingegrenzte Themenbereich, Y wird aus der Fragestellung abgleitet und Z begründet die Relevanz dieser Fragestellung. Wenn der Satz vervollständigt werden kann, bedeutet das, dass alle notwendigen Komponenten vorhanden sind. Es ist aber noch nicht möglich, eine Aussage über die Qualität der Komponenten abzuleiten – dazu ist eine inhaltliche Prüfung notwendig. Der Satz deckt aber logische Fehler in der Begründung der Relevanz sowie nicht zusammenhängende Aspekte der Fragestellung auf. Insofern stellt die Formulierung des Satzes eine empfehlenswerte Übung dar, deren Ergebnis in weiterer Folge auch die Grundlage für das Formulieren der Einleitung der wissenschaftlichen Arbeit bietet.

In unserem konkreten Bespiel könnte dieser Satz folgendermaßen aussehen:

„Ich möchte die Benutzbarkeit von Authentifizierungsmechanismen von sicheren Instant Messengern am Beispiel der Produkte X und Y untersuchen, um herauszufinden worin sich die Benutzbarkeit der Produkte X und Y unterscheiden, damit meine LeserInnen verstehen, dass ein adäquat gestalteter Authentifizierungsmechanismus für die Verbreitung von sicheren Instant Messengern zuträglich sein kann“.

Hier zeigt sich eine mögliche Schwäche der oben formulierten Fragestellung, da zur Verknüpfung zwischen der Benutzbarkeit des Authentifizierungsmechanismus und der Verbreitung eines Systems auch Information über eben diese Verbreitung benötigen würde, was in der Fragestellung bislang nicht abgebildet ist. Ein möglicher Ansatz wäre die Auswahl der Systeme X und Y an deren Verbreitung zu binden.

Literatur

Booth, W. C., Colomb, G. G., & Williams, J. M. (2003). The craft of research. University of Chicago press.

  1. Ist die geringe Verbreitung von sicheren Instant Messengern wie X oder Y durch die mangelnde Benutzbarkeit der eingesetzten Authentifizierungsmechanismen begründet?