人間の寿命の限界の証拠としてのセグメント化線形回帰の使用


8

Natureは今年、次の論文を発表しました:人間の寿命の制限の証拠1。著者は、彼らの彼らの結果は人間の最大寿命が固定され、自然の制約を受けていることを強く示唆しています」と主張しています。

この記事の統計分析の1つは、いくつかのサイトで既にパンニングされています。これには、Natureの記事が人間の寿命の約115年の制限と、一部の人気メディアで判明したため、効果的な査読の制限の証拠が間違っていることが含まれています。

この研究は、数ある中で、年間の最大死亡年齢を詳述するデータベースからのデータに基づいています。それらの分析には、次の図が含まれています。

http://www.nature.com/nature/journal/v538/n7624/images/nature19793-sf6.jpg

基本的に著者はブレークポイントがあると主張しているので、彼らは1995年頃の前とそれ以降にセグメント化された回帰を実行しました。回帰は、人間の寿命の限界の証拠として使用されます。

それは意味がありますか?そうでない場合、これらのデータを調査するためにどのような方法をより適切に使用できますか?

[1]ドン、シャオ、ブランドンミルホランド、ヤンヴィイグ。「人間の寿命の限界の証拠。」Nature 538.7624(2016):257-259。


4
極値の線形回帰は奇妙に思われます...そして、彼らは明らかに異常な不連続なセグメント化された回帰を使用しました...
kjetil b halvorsen

3
@kjetilbhalvorsenは同意しました。極値は、非常に乱暴に通常の仮定に違反するデータのよく知られた例です。Gumbelデータの最尤ルーチンはどのように実行されたのでしょうか...適切に名前が付けられた生存分析手法を使用しています
AdamO 2017

回答:


2

最初に、元の図2から手動で値を抽出し、生データの最初の目視検査にバイアスをかける色や回帰線なしでデータをプロットします。

year <- c(1968, 1970, 1973, 1975, 1978, 1979, 1980, 1981, 1982, 
          1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 
          1992, 1994, 1993, 1995, 1996, 1998, 1997, 1999, 2000, 
          2001, 2002, 2003, 2004, 2005, 2006)
age <- c(111, 111, 112, 111, 111, 110, 111, 113, 113, 113, 111, 
         114, 113, 114, 114, 112, 112, 112, 114, 115, 117, 112, 
         114, 115, 121, 119, 114, 115, 115, 114, 113, 114, 112)

plot(year,age,xlab="Year",
     ylab="Yearly maximum reported age at death (years)", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1960,2010))

私達は手に入れました:

散布図の年齢と年

そして、図6のデータについても同じようにします(上記の質問で示したとおり)。

age <- c(113, 109, 109, 110, 113, 109, 110, 111, 111, 111, 
         112, 112, 113, 111, 111, 113, 113, 113, 114, 115, 
         113, 114, 122, 119, 117, 114, 115, 115, 114, 114, 
         115, 116, 115, 115, 114, 114, 116, 116, 117)
year <- c(1954, 1957, 1958, 1958, 1963, 1964, 1965, 1967,
          1968, 1970, 1975, 1972, 1976, 1976, 1977, 1980, 
          1981, 1982, 1984, 1985, 1986, 1987, 1997, 1998, 
          1998, 1999, 2001, 2001, 2002, 2003, 2006, 2006,
          2008, 2007, 2010, 2011, 2011, 2012, 2015)

plot(year,age,xlab="Year",
     ylab="MRAD from GRG", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1950,2020))

ここに画像の説明を入力してください

単純な線形回帰モデルは、著者が提案したあまり簡潔ではない変化点モデルに挑戦する自然な候補になると思われます。実際、Philipp BerensとTom Wallisはそのようにして、再分析をgithubに公開しました:https : //github.com/philippberens/lifespan


1
図から値を取得する際に誤りを犯したようです-数年間データが欠落しています。
Scortchi-モニカの回復

うーん... ベレンズ&ウォリスによれば、著者は、「「失踪」は、MRADの人々が当時世界最古の人物の記録を保持していたジャンヌカルメントよりも若かったためである」と説明しました。したがって、他の人のデータは、それぞれが彼の死の年に死亡した最年長であったが、年長の誰かの存続が続いているために省略されている。ブレークポイントのレシピのように聞こえます!
Scortchi-モニカの回復

2
投稿の最初のバージョンでは、図2のみを含めました。図6のデータを追加しました。この図では、議論されたギャップを確認できます。
Brandmaier 2017

ごめんなさい!質問と同じ数字だと思っていました。
Scortchi-モニカの回復

4

結論の性質は完全に二義的だと思います。1950年から2015年の間に、増加傾向に続いて減少傾向が見られます。これは、テストされたものとは異なる仮説を示唆するデータを適用し、それらをそのように提示するという古典的な誤りです。これらのデータを使用すると、セグメント化された回帰は、1995年の寿命の極大値がセグメント化された回帰から推定するどのようなエラーでも約115年あったことを補間および予測できます。これは、その値に取って代わる2020年または2030年の傾向を排除するものではありません。±

  1. 自然寿命の概念は、老化、遺伝学、およびテロメアの研究の圧倒的多数と相容れない。
  2. 「ボディオンチップ」テクノロジーを使用して、人間の自然な寿命に対応する実験計画が必要です。
  3. 人類の歴史上、50年というのはまったく取るに足らないことです。過去には、寿命の増加傾向の後に減少傾向が続く多くの点がありました。
  4. 提示されたものなどのデータは、測定不可能な不連続および/または漸近線を持つ非線形モデルからシミュレーションできた可能性があります。
  5. モデルの目標は予測であるため、分布の仮定、および平均モデルの正確さが必要であり、これらはチェックされていなかったか、満たされていなかったかのようです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.