レビュアーとして、ジャーナルが利用できない場合でも、データとコードを利用可能にすることを正当化できますか?


23

科学は再現可能でなければならないため、定義により、データとコードの共有に関するエール円卓会議で議論されているように、データとコードは再現性の重要な要素であるという認識が高まっています。

データとコードの共有を必要としないジャーナルの原稿を確認する際に、データとコードを利用できるようにリクエストできますか

  1. レビュー時に私に
  2. 出版時点で公的に(ジャーナルはサプリメントをサポートしています)

また、そのようなリクエストをどのように表現できますか?


更新:一般的なケースに興味がありますが、この特定のケースは以前に公開されたすべてのデータを使用したメタ分析で構成され、コードはSASの単純な線形モデルです

サイドノートは、より多くの研究が生データを提供すれば、クロススタディ推論(メタ分析の目標である)を行う能力が大幅に強化されます

アップデート2

レビューのためにエディターにデータとコードを要求し、エディターはその要求を合理的であると見なし、1日以内に要求された資料を受け取りました(十分であるが、不可解な変数名、メタデータなし、インラインコメントはほとんどありません)。


3
個人的には、ほとんどどんな状況でもコードで大丈夫でしょう。データは別の問題です。既に一般公開されていない限り、私はそれを誰かと共有する許可を得られないでしょう。これにより、多くの状況でデータ要求が不合理になると思われます。
アンディW

4
これは、アソシエイトエディターまたはエディターと話し合う必要があるように思えます。彼らが仕事をしている場合、彼らはあなたにガイダンスを提供することができなければならず、おそらくそのような要求のための著者の連絡先として役立つでしょう。
枢機

1
多くの例とその後の議論は、学問分野や私たちが話しているデータに応じて大きく変化する事例的な状況に基づいているように思えます。確かに、いくつかの状況はデータを広めるのに完全に合理的と思われますが、それは必ずしもすべての状況を特徴づけるものではありません。この質問はすぐに暴言に変わります!
アンディW

1
@アンディは暴言から逃れる方法について何か提案がありますか?例えば、OPで行われるべき区別または回答の編集(結局CWです)。
安倍

1
このフォームには選択バイアスがあると思います:-)。私たちのほとんどは、何らかの形でOPのアイデアをサポートしているため、ここにいます。
-suncoolsu

回答:


7

レビュー担当者がデータを取得する限り、レビューを適切に完了するために必要な場合は、その資格があります。より多くのレビュアーがデータを要求し、評価する必要があります。多くのジャーナルには、レビューのためにデータと分析コードを必要とするポリシーがあります。

出版時点での可用性は私には明らかではありません。データを公開の条件として公開するという問題を強制したいと言っているようです。既にジャーナルポリシーではない場合、それは悪い考えです。パブリケーションを不公平なターゲットにしています。彼らは要件ではないことを期待して提出し、あなたも編集者もゲームを変えるべきだと考えました。

多くの研究者が公的に資金を提供している研究者には知られていないため、彼らは自分のデータを公開する必要があります。たとえば、ほとんどのNIH助成金には、研究者がデータを入手する必要がある条項があります。ほとんどの政府助成機関には、研究者が見つけたものを共有することを強制するデータ共有条項があります(その上で助成金を失うのは非常に難しいことを考えると、力は少し強いでしょう...更新を失う可能性があります)。データの対価を支払った一般市民は、それゆえに、一般市民はそれを受け取る権利を持っています。

収集する最も高価で機密性の高いデータである人間のFMRIデータは、最も一般的に公開されているものの一部です。PLoSだけでなく、この分野の主要なジャーナルでは、データの提出と、公開されているデータバンクの維持が必要です。これは、コスト(非常に高価)とプライバシー(小規模な研究から得られた人間のデータであり、時には非常に敏感になる可能性のあるユニークな臨床集団)の理由で異議を唱える人々に多くを語っていると思います。これらは、そのデータを一般の人々にとってより価値のあるものにする理由です。そのようなデータを差し控える研究者は、それを購入した人々(全員)に損害を与えており、彼らの責任が小さな研究室や出版物の競争以外で何であるかについてのレッスンが必要です。

研究が私的資金で行われ、真に私的資金で行われた場合、幸運を祈ります。


私はこれに含まれるもののほとんどに同意します-すでにデータを公開するための要件が​​あります-通常は他の資格のある研究者に-NIHの助成金などで。しかし、これを出版のアドホックな要件に拡張することは、レビュアーの役割を大きく超えていると思います。
フォマイト

1
(+1)思慮深く、明確な答え。覚えておくべきことの1つは、このサイトにはかなり国際的な視聴者がいるということです。NIHや他の組織が手を挙げていない場合でも、より多くの研究者が彼らの研究とデータに対して共同の見解をとることを望みます。
枢機

EpiGradは、回答から明らかでない場合、公開のアドホックな要件を作成することで、レビュアーの範囲を超えただけでなく、エディターも制限を超えたと感じました。
ジョン

枢機inal、賛辞をありがとう。リマインダーもありがとう。このサイトは国際的なものであることに留意してください。NIHと同じくらい大きいですが、私の国にはありません。;)
ジョン

@ジョン。ええ-私はあなたに同意しながら+1を入れるのを忘れました:)
Fomite

6

2つの状況に別々に対処する:

レビュアーとして:はい、データまたはコードを確認する理由があると思います。しかし、私があなただったら、コードの縮小やデータのサブサンプルなどを見る準備をします。この論文では常に報告されていない将来の研究を人々のコードに常に実装しており、あなたはそのコードに対する権利を有していません。私は主に生物医学研究を行っているため、かなり制限の厳しいデータ使用契約に対処する準備もできています。

ジャーナル自体で:いいえ。研究者が私の結果を再現したい場合、彼らは自分自身にアプローチしてコードを尋ねることができます。データについては、絶対にそうではなく、いかなる状況でもそうではありません。私のデータはIRBと機密保持契約によって管理されています-それは単に公開されるだけではありません。欲しいなら公開的なデータセットの場合、同様のプロパティを持つデータセット(つまり、Rのネットワークパッケージの1つで使用可能な「Faux-Mesa」ネットワークデータ)をシミュレートできますが、レビュアーとして、それを強制する呼び出しはありません。ジャーナル全体の要件である場合、著者は提出時にデータ/コードが公開されることを知っていましたが、そうでない場合は公開しません。あなたの役割は、本質的に哲学的/政治的ポイントであるものをプッシュするために論文の受け入れ/拒否に貢献するあなたの能力を使用するのではなく、論文自体の品質を評価することですジャーナルの範囲外。

せいぜい、コメントに「できる限りコードとデータを利用できるようにすることを著者に強くお勧めします」が、それ以上強いことは言いませんし、私はそれを入れません「これが日の目を見る前に修正する必要があると思うもの」の正式なリスト。


あなたの編集に気づいただけです:この場合、論文に関する限り、答えは実際には強い「いいえ」です-論文に引用があると仮定します。リクエストのポイントが「再現可能な研究」であり、データが公開されている場合、調査結果を確認しようとする研究者が自分でこれを行うことができなかった理由はありません。さらに、ポイントが実際に科学を評価する場合、単に「実行」をクリックして同じ結果を得ることができることを示すだけでなく、リテラートで検索および抽象化プロセスを実行することは、結果の検証の一部です。
フォマイト

研究を再現可能にするには、分析で使用されるコードとデータのバージョンを利用可能にする必要があり、分析で使用されないコードは予期されません(または必ずしも関連しません)。
デビッドルバウアー

@EpiGrad:あるレベルでは、この強いnoにはまったく同意しません。キース・バガリーは最近この主題について伝道しており、興味深い観察をしています。たとえば、KA BaggerlyおよびKR Coombes、「細胞株からの化学感受性の導出:法医学的バイオインフォマティクスおよびハイスループット生物学における再現可能な研究」Ann。適用 統計 、vol 3、no。4、pp。1309-1334。arxivバージョンもあります。
枢機

適切に匿名化されたデータの公開を真に制限するIRBと機密性の問題を抱えている助成基金研究者はほとんどいません。そのような状況にある場合、それは非常にまれなケースです。
ジョン

@EpiGradまた、強いnoについても質問します。メタ分析で生データから派生メトリックを取得するために使用される方法では、多くの場合、個々の研究レベルで発生する方法論と解釈の違いに関連する多数の仮定が必要です。この場合、200以上の研究が表されているため、データセットの再構築に必要な時間は非常に長くなり、最終的には科学の進歩という究極の目標が阻害されます。
デビッドルバウアー

5

ジョンは言う査読へのデータの可用性は非常に簡単あってはなりません。慎重なレビューには、分析の複製を含める必要があります。そのため、データへのアクセスが必要です。

公開後のデータの公開に関しては、特定の投稿に関してではなく、一般的にジャーナルとの戦いが必要だと思います。

より一般的な注意点として、資金提供機関とIRBは、データ共有が科学的および倫理的に必要な研究要素であることをますます認識しています。正しい誤ったレポートの新しい結果をもたらす可能性のある再分析の可用性を高めることにより、データ共有は研究に対する潜在的な利益を増やし、それによって、費用/利益のトレードオフを研究の参加者の利益に修正します。確かに、データが共有される可能性を参加者に通知する必要があり、参加者の身元確認のリスクが高まるのを防ぐためにセーフガードを設定する必要もありますが、これらはほとんどの状況で達成できます。私自身の研究では、参加者(および私のIRB)に、(1)データが強力な暗号化形式で保存されることを保証します(復号化技術の進歩に伴い更新されます)。


1

私はこれに関する経験はありませんが、結果をレビューする際にあなた自身のデューデリジェンスの一部として#1を主張できるかもしれないと私には思えます。しかし、#2を主張する方法はわかりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.