Internetlinguistik. Konstanze Marx
Чтение книги онлайн.

Читать онлайн книгу Internetlinguistik - Konstanze Marx страница 11

Название: Internetlinguistik

Автор: Konstanze Marx

Издательство: Bookwire

Жанр: Документальная литература

Серия: narr studienbücher

isbn: 9783823302360

isbn:

СКАЧАТЬ Datenbank vorzubereiten ist die systematische Eingabe der Texte in Felder einer (Excel-)Tabelle. Das soll an einem Beispiel veranschaulicht werden (siehe Tabelle 1-1, angelehnt an das Muster auf www.bubenhofer.com).

Text 1 Text 2 Text 3
Quelle www.sueddeutsche.de
Datum 16. Februar 2011
Autor/en Roland Preuß, Tanjev Schultz
Überschrift Plagiatsvorwurf gegen Verteidigungsminister/Guttenberg soll bei Doktorarbeit abgeschrieben haben
Untertitel 1 Verteidigungsminister Guttenberg muss sich gegen Vorwürfe wehren, er habe bei seiner Doktorarbeit getäuscht. Nach SZ-Informationen gibt es in seiner Dissertation einige Passagen, die er ohne Angabe von Quellen wörtlich zitiert. Nach den jüngsten Bundeswehrskandalen wird Dr. Karl-Theodor Freiherr zu Guttenberg nun neue Kämpfe ausfechten müssen.
Untertitel 2 Die Doktorarbeit sei an mehreren Stellen "ein dreistes Plagiat" und "eine Täuschung", sagte der Bremer Juraprofessor Andreas Fischer-Lescano, der die Parallelen mit anderen Texten bei einer Routineprüfung entdeckt hat. Fischer-Lescano lehrt an der Universität Bremen Öffentliches Recht, Europa- und Völkerrecht. […]
Zwischentitel „Ungewöhnliche Verkettung von Glücksfällen“
Text Es war offenbar nicht einfach für Karl-Theodor zu Guttenberg, seine Doktorarbeit zu vollenden, das macht er im Vorwort klar. Günstige Momente zur Fertigstellung habe er "durch freiberufliche wie später parlamentarische 'Ablenkung' versäumt". Der CSU-Politiker verweist auf eine Mischung aus "eherner professoraler Geduld" und "sanftem, aber unerbittlichem familiären Druck", der das Projekt doch noch zum Abschluss führte. "Diese Arbeit entspringt einer ungewöhnlichen Verkettung von Glücksfällen." […]
Rubrik Politik
Quelle www.sueddeutsche.de/politik/plagiatsvorwurf-gegen-verteidigungsminister-guttenberg-soll-bei-doktorarbeit-abgeschrieben-haben-1.1060774

      Tab. 1-1:

      Vorschlag für eine Systematisierung von Korpustexten in einer Excel-Tabelle

      Sind die Daten so gespeichert, lassen sie sich am einfachsten über den Datei-Explorer durchsuchen. Je größer die Datensammlung jedoch wird, desto günstiger ist der Import in geeignete relationale Datenbanksysteme, z. B. Access, Filemaker oder Oracle.

      Excel-Tabellen lassen sich unter „speichern unter“ im CSV-Format abspeichern. CSV ist die Abk. für comma separated value, die Werte in der Tabelle werden also in eine Liste übertragen und dadurch importfähig.

      Das Grundgerüst der Datenbank kann ähnlich strukturiert sein wie die vorbereitete Tabelle. Um einen Datenimport aus der Excel-Tabelle beispielsweise vornehmen zu können, werden oftmals sogenannte CSV-Dateien eingesetzt, die die Angaben in der Tabelle in einen importfähigen Datensatz übersetzen. Zudem müssen beim Einsatz von Datenbanksystemen Ein- und Ausgabemasken sowie Auswerteprogramme, sog. Reports, programmiert werden – eine Aufgabe, die ohne EDV-Kenntnisse schwer zu bewerkstelligen ist.

      Es ist auch möglich, Korpora mit sogenannten Scrapern aufbauen. Grundkenntnisse im Programmieren, z.B. mit Python, sind hierbei von Vorteil.

      Für Studierende ist erfahrungsgemäß die Angabe einer Mindestgröße für eine Belegsammlung von großer Bedeutung. Mit Schlobinski (2011: 133) könnte man dieser Frage folgendermaßen begegnen: „Gegenüber Aussagen, die allein auf der Grundlage der Introspektion gewonnen wurden und somit eine Einerstichprobe darstellen, ist jede auch noch so schmale Datenbasis ein Gewinn. Auf der anderen Seite sollte man generell vorsichtig sein, wenn aufgrund weniger Belege Aussagen über Sprachen oder gar Sprachfamilien getroffen werden, die von Hunderten, Tausenden oder gar Hunderttausenden gesprochen werden“ (Schlobinksi 2011: 133). Es gibt aber auch Ansichten wie: „Kein Korpus ist groß genug, um die Diversität der Daten im Hinblick auf Parameter wie Medium, Thematik, Stilebene, Genre, Textsorte, soziale, areale, dialektale Varietäten, gesprochene vs. geschriebene Texte etc. repräsentativ abzubilden. Versuche, das Problem durch Erweiterung der Stichprobe zu lösen, vergrößern nur die Diversität der Daten im Hinblick auf die bekannten (und möglicherweise noch unbekannte) Variabilitätsfaktoren und damit die Inhomogenität“ (Köhler 2005: 5). Kurzum: Wir können hier keine konkreten Zahlen nennen, als Faustregel gilt jedoch, dass genügend Daten vorhanden sind, sobald sich ein Muster finden lässt.

      Für wissenschaftliche Hausarbeiten und studentische Forschungsprojekte sollte der Aufwand dabei einerseits überschaubar bleiben, andererseits muss die Datensammlung genügend Belege aufweisen, um Aussagen treffen zu können. QualitativeQualitativ Aussagen lassen sich manchmal auch schon mit einem vergleichsweise kleinen Korpus treffen. Allerdings darf dabei dann kein Anspruch auf Repräsentativität erhoben werden. Die Ergebnisse der Analyse eines kleinen Korpus treffen eben auf genau dieses Korpus zu. Generell ist zu beachten, dass Themen für korpusbasierte BA- oder MA-Projekte schon mit dem Vorlauf festgelegt werden sollten, der für die Generierung eines Korpus kalkuliert wird.

      Zwar dürfen Korpora nur mit Zustimmung der Datenurheber*innen veröffentlicht werden, sie sollten jedoch für Ihre*n Prüfer*innen zugänglich sein, z. B. digital in einem geschützten Bereich, für den Sie einzig dem*der Prüfer*in Zugang gewähren.

      1.4.3 Klick ins Feld: Einfach einmal nachfragen?

      Online-Umfragen sind ein beliebtes Instrument in der empirischen Sozialforschung. Im folgenden Abschnitt soll diskutiert werden, inwieweit sie auch für sprachwissenschaftliche Datenerhebungen СКАЧАТЬ