OSR016 Kollaborative Wissenschaft

Kommentare 6

Flattr this!

Ein bißchen später als ursprünglich geplant, haben wir uns wieder zusammengefunden zur 16. Ausgabe vom Open Science Radio. Mittlerweile ist es in der Wissenschaft ja nicht mehr unüblich in verteilten Arbeitsgruppen und mit mehreren Autoren zusammen an Themen und Papern zu arbeiten. Also haben wir uns in dieser Episode einmal angeschaut, wie es um das kollaborative Arbeiten, insbesondere vor dem Hintergrund von Open Science, so steht. Viel Spaß!

Übrigens: dieses Mal hat uns Skype einige Probleme bereitet, sodass wir ein wenig schneiden mussten. Wir hoffen das es nicht allzu störend ist.


Episode Info:
Duration 1:58:07
Recorded on 01-01-1970, Published on 13-04-2014
This work is licensed under the CC BY-SA 3.0 DE license.

Downloads:

Teilnehmer:
avatar Konrad Förstner
avatar Matthias Fromm Thomann Wishlist Icon Amazon Wishlist Icon

Shownotes:

Begrüßung

00:00:00

Vielen Dank für die wohlwollenden und kritischen Kommentare.

KOLLABORATIVES ARBEITEN

00:43:46

Die Bestandteile des Wissenschaftlichen Prozesses;.

Kollaboration: Ideenfindung und Hypothesenformulierung

00:47:47

Benedikt Fecher; — Benedikt's Blogpost für seinen Forschungsansatz zu Open Science; — Matthias's erste Erfahrungen mit dem Open Science Framework; — Open Science Framework; — Matthias hat beim OSF nachgefragt; — Argument Maps e.g. ArguNet;.

Kollaboration: Prozessierung, Visualisierung, Kontextualisierung

01:01:50

Verteilte Versionverwaltungssysteme für Toolentwicklung und Datenversionierung; — CVS; — SVN; — CRE 130 Verteilte Versionssysteme; — BitKeeper; — GIT; — GitHub; — Markdown; — Kollaborative Visualizierung mit plotly;.

Kollaboration: Manuskript

01:10:30

generelle Tool zu Textbearbeitung wie Wikis, Google Docs, Etherpad etc.; — Etherpad; — Markup language; — Referenzen sind in der Regel ein Problem, hier kann man BibTex oder ähnliches verwenden; — BibTeX; — BibDesk; — kurzer Hinweis auf das Open Science Thesis Repository auf Github; — Tools: — Fiduswriter; — Fiduswriter is Open Source und auf Source Forge und Github verfügbar; — Open Journal Systems; — Penflip; — Wikidocs; — Booktype; — Authorea; — LaTeX (LaTex- basierter WYSIWYG-Editor Lyx;)  — writeLaTeX; — ShareLaTeX; — Sparkle Share; — owncloud hat einen LaTeX editor; — Chaosradio 199 zu Eigenhosting;.

Kollaboration: Publikation

01:43:45

PeerJ; — arXiv; — bioRxiv; — Figshare; & Co..

Kommentare 6

  1. Sehr schöne Folge, wie ich finde. Habe vorher auch schon gerne dem Open Science Radio gelauscht, aber mit Konrad hat die Sache noch gewinnen können. Ist wohl doch etwas anderes, wenn man einem Gespräch lauscht statt einem Monolog.

    Also, kurzum: Dickes Lob!

    • Hi Olli!

      Danke für den Zuspruch! Geht mir übrigens genauso, dass ich finde, dass das Format mit Konrad um einiges gewonnen hat! 😉

      Cheers,
      Matthias

  2. Hallo,

    sehr schöne Folge, die OSR16 🙂

    Nun zur Sache:

    Danke für die Nennung meiner Kommentierung 🙂

    Jaaa, ich bleibe Euch als Hörer erhalten,
    auch, wenn das jetzt so lange Podcasts sind.
    Ich stelle vielleicht meinen Worflow etwas um.

    Ich bin übrigens erst spät zu OSR gestossen, habe aber dann
    die alten Folgen noch im Nachhinein angehört 🙂

    Zur rezeption meiner Kommentare noch eine Korektur:

    Mir ging es nicht um “eigene vs. nicht-eigene Daten”, sondern ORIGINALE vs. ABGELEITETE Daten.
    Zum Beispiel ist es IMHO auch ein problem, wenn man die Originaldaten
    benutzt, redlich den Autor / Urheber der Originaldaten zwar benennt,
    aber daraus einen “gereinigten” / modifizierten Datensatz ableitet (und weiter verbreitet),
    bei dessen verbreitung zwar die Originalquelle benannt wird, dennoch aber
    die abgeleiteten (modifizierten) Daten als Originaldaten der eigenen Untersuchung
    ausgibt.
    Damit wird zwar die Quelle genannt, man ist also bezüglich Zitierung / Benennung der
    Originalquelle korrekt, es werden jedoch nicht wirklich mehr die originaldaten verwendet,
    und nach dem prinzip “Stille Post” modifizierte Daten weiter verbreitet, wenn der
    nächste, der die “neuen Originaldaten” benutzt, nicht in der Kette bis ganz zurück an den
    Anfang geht und stattdessen nur auf die vorherige (eben benutzte/zitierte/vorangegangene)
    Quelle zurück geht.

    So mag es bei der Eliminierung von “Ausreissern” andere herangehensweisen geben.
    Was dem einen sein Ausreisser in den Daten ist, ist dem Anderen die grundlage für
    genaue statistische Analyse, die zu Ergebnissen führt, die man bei “Wegbereinigung”
    der Ausreisser nicht durchführen kann.

    Da es bei großen Datensätzen (aber selbst bei noch halbwegs überschaubaren Datensätzen)
    schon mal vorkommen kann, daß es kaum auffällt, wenn original und abgeleiteter Datensatz
    nur in einem oder einigen wenigen Punkten auseinander driften (also einige Datenpunkte fehlen),
    ist eine Hashsumme IMMER sinnvoll.
    das spart viel Arbeit, denn wer will jedesmal die gesmaten Datensätze auf Konsitenz prüfen?
    Eine Hash-Sum ist einfacher vergleichbar.

    Mir ging es also nicht um Nennung des Urhebers, sondern um nicht-Veränderbarkeit des Datensatzes.

    Das war insofern besonders hervorhebenswert, da Ihr meintet,
    man solle eine entsprechende Creative-Commons-Lizenz benutzen,
    die jedwede Benutztung inkl. veränderung des originals gestattet.
    In dem Falle ist aber kenntlich zu machen, daß man die Daten verändert hat.
    Selbst wenn das ehrlich gehandhabt wird und genannt wird:
    Wenn das irgendwo in einer Fußnote steht, geht das womöglich unter.
    wenn die Datensätze per Hashsum nochmal verifiziert werden können,
    und solche Angaben mandatory sind, dann ist es sehr einfach zu sehen,
    ob man einen anderen Datensatz als Grundlage der Untersuchung heran gezogen hat.

    Ich hoffe, das Problem und mein Einwand ist nun ersichtlich.

    für eine solche hashsum-Bildung müssen natürlich die Daten in
    einer einheitlichen Form / einheitlichem Format abgelegt werden.

    Bisher habe ich so etwas noch nirgends thematisiert gefunden.

    Hier ist IMHO eine Lücke zu finden.
    ==============================
    Argument Maps:

    sehr geil.

    Seit einiger Zeit denke ich drüber nach, so etwas zu implementieren!

    http://www.argunet.org/
    http://www.argunet.org/2013/04/03/so-what-exactly-is-an-argument-map/

    Und nun gibt es sowas ähnliches schon.

    Toller Hinweis, das wil ich mir demnächst mal anschauen.

    Ich mag aber ohnehin lieber lokale Apps und bin auch Kommandozeilen-Junky…
    …mal schauen, in wieiweit ich mich mit dem tool anfreunden kann.

    Aber als Anregung bzw. verfeinerung meiner eigenen Ideen sicherlich ein toller Hinweis.
    ==============================

    Kollaborativ und KEIN Word – Ihr sprecht mir so aus der Seele!!!!!!
    Verschiedene Worddateien usw. oh, yes.
    Das finde ich schon seit mindestens eineinhalb Dekaden so zum ko..en.
    Weenn ich von LaTeX und offenen Standards geredet habe, hat man mich wohl
    eher in die Kategorie Computer-Spinner abgelegt.
    Schön, daß Ihr das hier aufgreift.

    Vielleicht wird LaTeX & Co. ja aufgrund OpenScience und verteiltem Arbeiten
    inkl. git & Co. doch noch etwas breiter genutzt werden.

    sehe ich eigentlich als zwingend an.

    “Es ist eigentlich erstaunlich, daß das in der Wissenschaft so lange so schlecht betreieben wurde!”

    JAAAAAAAAAAAAAAAAAAAAAAAA.

    Danke!

    Das musste mal gesagt werden! 🙂

    ==============================
    “It’s a tragedy we had to add the word open to science.”

    SUUUUUUUUUUUUPER ZITAT!

    ==============================
    OpenScience … Neoliberalismsu — wichtig!
    Bitte aufgreifen.
    Ich sehe hier Parallelen zu Kulturflatrate vs. Marktmechanismen.
    ScienceFlatrate?
    ==============================
    http://www.nachdenkseiten.de/?p=21417
    ==============================
    2004 das Jahr schmerzfreier, kollaborativer Paperscheiberei?!
    Ich dachte, wir schriebn das Jahr 2014?! 😛
    ==============================
    Shownotes: sehr hübsch jetzt.
    ==============================

    Gruß,
    Oliver

    • Moin Oliver!

      Ich hab gerade wenig Zeit, aber so viel Zeit muss sein: vielen Dank wie immer für Deinen ausführlichen Kommentar!

      Cheers,
      Matthias

  3. Hey Oliver,

    und wir behalten dich trotz Deiner langen Kommentare. 😉 Echt mal wieder super von Dir – danke für das ausgiebige Feedback und Deine Verweise!!!

    Das Problem der Orignal/Derivatdatenaufchlüsselung wäre dann dem Thema Data-Lineage zuzuordnen, würde ich sagen. Das könnte man theoretisch lösen indem man mit Git/OpenScienceFramework o.ä. arbeitet und dann immer Forks von den vorherigen Arbeiten macht, oder? Das heißt die Tool wären jetzt da und jetzt müssen die Leute es “nur noch machen”. 😉

    Es gibt auch noch weitere Argument-Map-Tools (https://en.wikipedia.org/wiki/Argument_map#Argument_mapping_software), wenn du kein Online-Tool nutzen möchtest.

    Können wir meinen 2004-Fehler unter Messfehler verbuchen? Ja, ich meinte 2014 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *