Warum Soziologen Interesse an Informatik haben sollten

laptop_stift_klein

Auf den ersten Blick haben Informatik und Soziologie wenig miteinander zu tun. Vielleicht sollte ich auch eher sagen, ein Soziologe sollte auch immer ein Programmierer sein. Informatik geht ja doch über das reine Programmieren hinaus. Es kommt auch darauf an, welche Richtung man einschlagen will. In der theoretischen Soziologie ist es wahrscheinlich weniger notwendig. Wer aber empirisch forschen möchte (egal ob in der Wissenschaft oder Wirtschaft), der wird um den Kontakt mit Programmiersprachen nicht  herum kommen. Durch neue Kanäle für Umfragen, rücken Themen aus der Informatik auch in die Soziologie und deren Berufsfelder vor. Die Datenbanken werden immer größer und komplexer. Es gibt inzwischen eigene Forschungsbereiche, die sich mit der Archivierung von qualitativen und quantitativen Daten beschäftigen. Man sollte also wenigstens am Programmieren interessiert sein, sofern man in diesem Bereich mal arbeiten möchte.

(weiterlesen …)

Prozente oder absolute Anzahl?

Prozente oder absolute Zahlen? Eine Frage die mir schon öfter begegnet ist. Das Hauptargument gegen Prozentzahlen ist, dass gerade bei einer kleinen Anzahl, der Eindruck entsteht, man könne die Zahlen verallgemeinern, oder es würden höhere Fallzahlen suggerieren. Einerseits ist es natürlich schon etwas fragwürdig, wenn man schreibt, dass beispielsweise 20% irgendwas angegeben haben, die 20% aber nur 3 Fälle repräsentieren. In einer Tabelle mit Zahlen ist das auch ok. Die Frage, die mich aktuell beschäftigt, ist auf Diagramme bezogen. (weiterlesen …)

Gewichten oder nicht gewichten, das ist hier die Frage!?

Gewichtungen kommen bei verschiedenen Szenarien zum Einsatz. Als Ausgleich von Auswahlwahrscheinlichkeiten die durch die Methode der Stichprobenziehung verursacht werden. Bei Längsschnittstudien, die stark unterschiedlich große Samples aufweisen und als Ausgleich für Verzerrungen durch systematisches Beteiligungsverhalten in der Befragung. Bei letzterem geht es also darum, dass verschiedene Gruppen unterschiedlich stark an Umfragen teilnehmen. Aber auch bei Querschnitts-Erhebungen können Abweichungen von bekannten Verteilungen in der Grundgesamtheit auftreten.

(weiterlesen …)

Mehrfachantworten im Datensatz kodieren

Bei der Kodierung eines Fragebogens kommt es vor, dass man eine Frage mit Mehrfachantworten umsetzen muss. Da man in eine Variable nur jeweils einen Wert einfügen kann, muss man in diesem Fall andere Methoden anwenden. Grundsätzlich gibt es zwei Methoden das Problem zu lösen.

  (weiterlesen …)

Zusammenfügen unterschiedlicher Daten

querWenn man Variablen in zwei verschiedenen Dateien hat, kann man sie einfach mit einem Statistikprogramm zu einer Datei zusammenfügen. Sind beide Datensätze im selben Format ist das auch nicht weiter ein Problem.
Wenn man aber Verlaufsdaten (Bild2) und Querschnittsdaten (Bild1, jeweils klicken zum vergrößern) hat und diese zusammenfügen will, dann ist das nicht ganz so einfach. Je nachdem wie man es macht, kommen ganz unterschiedliche Ergebnisse zustande.

(weiterlesen …)

Gute Statistikbücher

Ich habe ja in meiner Literaturübersicht schon ein paar Bücher zu statistischen Methoden empfohlen. Da ich aber nicht alle Bücher, die es zu dem Thema gibt,  lesen und deren Qualität beurteilen kann, will ich an dieser Stelle mal meine Leser fragen.

Wenn ihr ein gutes Buch zur Statistik kennt, das sehr hilfreich bei der praktischen Arbeit mit Statistik ist, so schreibt doch bitte den Titel in die Kommentare. Dazu vielleicht noch ein paar Worte zu den Stärken und Schwächen des Buches.

Tipps für Wissenschaftsblogger

Lars Fischer hat auf seinem Blog 13 Tipps für Wissenschaftsblogger zusammengestellt, wie man den aktuellen Forschungsstand herausfindet.

Eine sehr gute Liste, die man übrigens auch als Student für Hausarbeiten nutzen kann.

Tobias Maier bietet ebenfalls Tipps für Blogger an. Er gibt Tipps für den Start eines Wissenschaftsblog. Wer also am überlegen ist, ein solches zu eröffnen, sollte dort einmal vorbeischauen.

Der Eis-Index

Der “Big-Mac-Index” dürfte ja bekannt sein. Aber es gibt ja vielleicht noch andere einfache Indikatoren für Preise und Kaufkraft. Bei einem Gespräch mit einem Freund, kam das Thema Eis und die regional schonmal unterschiedlichen Preise dafür auf. Wir stellten fest, dass der Preis für eine Kugel Eis an einer normalen Eisdiele ein Indaktor für das allgemeine regionale Preisniveau sein könnte.

Wenn ich genügend Eispreise hätte, könnte ich diese mit den Statistiken zu den regionalen Lebenshaltungskosten vergleichen. Die Frage ist nur, wie man sowas herkriegen könnte. Durch ganz Deutschland reisen wäre wohl etwas kostspielig.

Vielleicht ist die Idee auch zu abgedreht. Was meinen denn meine werten Leser dazu?

Wissenschaftliche Auswertung des “Studenten-Pisa-Tests”

Der Spiegel will nun seine Daten, die in dem Wissens-Test gewonnen wurden, wissenschaftlich auswerten lassen und die Ergebnisse in einem Sammelband veröffentlichen. Die Ausschreibung kann man sich hier ansehen.

Inwieweit die Daten aber auch tauglich für eine wissenschaftliche Auswertung sind bleibt offen. Zwar wurden die Fragen wohl einem wissenschaftlichen Pretest unterzogen, doch nützt dies nichts, wenn die Daten insgesamt nicht repräsentativ sind. Rund 600.000 Fälle sind zwar eine stolze Zahl, doch für die gesamte Studentenschaft in Deutschland repräsentativ würde ich die Daten nicht bezeichnen. Es haben auch nicht nur Studenten mitgemacht. Ohne näheres zu wissen, würde ich mal sagen, dass die Grundgesamtheit wohl eher aus Spiegel-Online Leser, sowie Mitgliedern von StudiVZ besteht. Zudem bestand bei den Fragen eine Möglichkeit zu schummeln. Zwar hatte man nur eine gewisse Zeit im eine Frage zu beantworten, wer aber schnell auf den einschlägigen Seiten oder Google suchte, konnte durchaus bei der ein oder anderen Frage, sein Wissensdefizit ausgleichen. Von daher zweifle ich auch die Verlässlichkeit der Daten an.

Vielleicht weiss ja noch jemand der werten Leser mehr. Aber aus dem was in den Artikeln dazu stand, bzw. vor allem, was dort nicht stand, sehe ich keine Basis für eine wirkliche wissenschaftliche Auswertung.