U字型関係の厳密な定義とは何ですか?


7

変数間のU字型または逆U字型の関係を(回帰フレームワークで)分析するいくつかの論文を見てきました。私がそこから得た一般的な理解は、私たち全員が簡単に視覚化できる特定のタイプの非線形関係であるということです。

しかし、U字型の回帰関数を正確に数学的に定義する方法について少し混乱しています。簡単にするために、リグレッサだけがあると仮定しますx

U字型の回帰関数を持つことは、回帰関数が凸状であり、ある点までで減少し、その後が凸状でで増加することを意味しますか?xccx

または、単に回帰関数がある点まで減少し、その後がで増加することを単に意味しますか?xccx


3
著者が異なれば定義も異なる可能性があります-関係は継続的でなければなりませんか?区別できる?凸?「増加してから減少する」または「減少してから増加する」という考えと一致する最も一般的な定義は、次のとおりです。f:ARAR 「U字型」は、分解が存在することを意味します A=BC ここで(1)のすべての要素 B のすべての要素以下 C; (2)f 両方で単調です B そして C; (3)画像f(B) そして f(C)それぞれに少なくとも2つの値があります。(4)の単調性の方向f 異なる B そして C
whuber

@whuberこれはまさに私が探しているものです
Neznajka

2
私は一般的な合意を証明できませんでした-そして、多くの著者が私の定義が彼らの意図したものよりも広いことに異議を唱えると確信しています。それがコメントとして残した理由です。
whuber

3
「U字型」は数学的に明確に定義された用語ではないと思います。普遍的に受け入れられている定義はなく、私はあなたがそれを探すべきではないと思います。それを強調するために、私の回答の最初の2文を変更しました。
amoeba

回答:


8

(他の場所で述べられているように)あなたの質問への短い答えは、U字型の単一の数学的定義がないということです。@whuberのコメントは、私が見た中で最も一般的な定義です。

私はU字型のテストについて研究しており、プレゼンテーションには「Uとはどういう意味ですか?」というタイトルのスライドがあります。つまり、「U字型」という言葉が意味する主観的なものです。最も重要なことは、あなたが用語「U字型」を使用する場合、あなたは正確に何を定義することであるあなたに他の人があなたが何を意味するか知っているだろうことを想定せず、それによって意味します。

リグレッサが1つだけの場合を指定したので、それに焦点を当てます。以下の定義がさまざまな記事で使用されているのを見てきました。

  • U字型は2次式です。
  • U字形は凸状を意味します(これらの線に沿ったアプリケーションについては、Van Landeghemの2012年「ライフサイクル全体にわたる人間の福利の凸性のテスト:20年のパネルからの縦断的証拠」を参照してください)。
  • U字型は、あるポイントまでは加重平均導関数が負で、そのポイント以降は加重平均導関数が正の関数です(Uri Simonsohnの2行:U字型関係の最初の有効なテストを参照)参照)。
  • U字型は、ちょうど1つのターニングポイントを持つ関数です。これは、準凸ではあるが単調ではない関数に対応します。

発生する複雑な問題の1つは、ターニングポイントがx変数の範囲の両端に近い場合はどうなるでしょうか。このような関数をU字型と見なす必要がありますか?私の意見では、このような議論は、アプリケーションでU字型が何を意味するかを定義するとき、および帰無仮説を指定するときに行う必要があります。

私の論文「U字型関係のノンパラメトリックテスト」で使用する定義は次のとおりです。

しましょう m(x) 回帰関数にしてみましょう S(X) のサポートになります X。指定セットについてA0S(X)、以下のテストに関心があります。

H0:aA0 st xS(X)m(x)(xa)0versusHA:aA0,xS(X) stm(x)(xa)<0

たとえば、アプリケーションで、20歳から70歳のU字型の生活満足度をテストします。ターニングポイントは30歳から60歳です。この提案されたフレームワークでは、任意の決定が必要です。重要なことは、それらについてオープンであり、変更に対する機密性の高い結果がどのように影響を受けるかを確認することです(そして、他の人に同じことをするように挑戦する)。

帰無仮説を述べることに加えて、いつものように、依存する仮定を述べる必要があります。たとえば、一般的な仮定は、回帰関数が単調のU字型であるというものです。たとえば、Lind and Mehlumの2009年「Uの有無にかかわらず、U字型関係の適切なテスト」を参照してください。そこでは、指定された関数形式の導関数が負であることをテストすることにより、バニラOLS範囲の始まり、終わりは正。

考慮すべき追加のポイントは次のとおりです。U字型の小さな違反のために帰無仮説を棄却するテストが必要ですか?はいの場合、Rパッケージqmutestを検討してください。これは、回帰関数が準凸であり、それが単調であるという帰無仮説のスプラインに基づいてノンパラメトリックテストを実装します。小さな違反のためにU字形に対して推論を行うテストが不要な場合、回帰関数がほとんど減少してからほとんど増加することをテストする場合は、Uriの2行テストが最適です。

「U字型」という用語の使用と定義についての質問だったので、「U字型」と「逆U字型」と同じものを指すためによく使用されるいくつかの用語をここにリストすることは妥当だと思います。 "は、「谷型」、「谷型」、「丘型」、「ユニモーダル」、「シングルピーク型」、および「ベル型」を指すために使用されます。「U字形」が他の言葉よりも優れているという固有の理由はありませんが、その使用は定着しているようです。

私は、U字型の関係をテストする特定のRパッケージ(qmutestなど)へのインターフェースとなる一般的なRパッケージに取り組んでいますが、それらを定義することを選択しています。目標は、ユーザーがさまざまなテストを比較し、テストしたい正確な帰無仮説と、ユーザーが行う準備ができている仮定について一生懸命考えることです。


1
+1。「U字型の小さな違反のために帰無仮説を棄却するテストが必要ですか?」この文に少し混乱しています。ヌルはU字型がないことであると思います。そのため、十分に小さいp値がU字型の証拠でしたが、それは正しいですか。
amoeba

1
(私はあなたがウリの論文に好意的に言及したことを嬉しく思います:私はここで私の答えでそれを言及し、コメントで強く批判されました。)
amoeba

3
(+1)非常に素晴らしく、思慮深く、権威ある概要。当サイトへようこそ!
whuber

1
@amoeba「U字型」を使用するときは、上記の定義4(1つのターニングポイントを持つ関数)を参照しています。私のテストでは、ヌルはU字型です。つまり、基礎となる回帰関数にU字型の違反があると(たとえば2つの転換点がある場合)、U字型のヌルは漸近的に拒否されます。2行の検定は平均導関数に関するものであるため、これはUriの検定には当てはまりません。したがって、U字型に対する漸近的な推論に必ずしもつながることなく、小刻みに動く可能性があります。
scottkosty

1
@amoeba例として、私の論文の図2の「sin」というラベルの付いた関数を参照してください。私は(私はチェックしていませんが)2つの線のテストは漸近的な推論を与えると信じています。
scottkosty

7

「U字型の関係」は数学的に正確な用語ではなく、広く受け入れられている定義はありません。これは通常、関係が最初に減少し、次に増加する、またはその逆であることを意味します。

つまり、関係は単調(非単調)ではなく、1つの極値(最大または最小)を持ちます。コンピュータサイエンスでは、これを「ビットニック」と呼ぶことあります。

Uri Simonsohnは最近、U字型の関係のテストに関する興味深い論文を書きました。彼のプレプリントの2行を参照してください。非常に読みやすくて面白い、2次回帰を使用したU字型の関係の無効なテストの有効な代替手段です。これが論文の始まりです:

冒頭の文に選択肢、美徳、例が多すぎるようなことはありませんか?研究者はしばしばこれらのタイプの質問に関心があり、その影響を評価するx オン y の低い値に対して正です x、ただし値が大きい場合は負 x。説明を簡単にするために、「U字型」、対称であるかどうか(U字型またはJ字型など)、およびx オン y 負から正またはその逆(つまり、Uまたは逆U)になります。

これは、上記で定義した定義をサポートしています。


Uriの論文の簡単な概要については、彼のDataColadaの投稿Two-lines:The First Valid Test of U-Shaped Relationshipsを読むことができます。主なポイントは、二次回帰を使用してU字型の関係の存在をテストすることは非常に間違っているということです。一部の分野では、U字形の関係を支持するために、2次近似がよく使用されるようです(つまり、2次項のt検定はU字形の検定と見なされます)。これは厄介です。

キー数値は次のとおりです。

U字型の関係

更新:コメントにウリの論文に対するいくつかの批判があります。私は、不連続な2行の近似がデータをうまくモデル化することになっている(または不連続点でのジャンプに物理的な意味がある)ことを彼が決して示唆していないことを強調したいと思います。いいえ。このフィットは、U字形の統計的検定を提供する目的のみ使用されます。

もちろん、そのような非線形関係を近似するためにスプラインモデルを使用する方がはるかに理にかなっていることは、@ FrankHarrellに同意します。しかし、スプラインはU字形のテストを提供しませんが、Uriの2ラインフィットは提供します。


4
二次曲線は、そもそも変化する勾配を指しています。これを確認するのに非常に良い方法(または多くの場合、少なくとも簡単な方法)だと私は思います。しかし、(真の)根本的な関係を表現する非常に非常に悪い方法です。特に、関係のUネスです。
Sextus Empiricus

4
読んだだけです。彼は、「2つの線を接続するように強制するとバイアスが生じる」と述べています。なんと奇妙な議論でしょう。接続できないようにすると、不可能になります。2行の議論全体が弱いと思います。スプラインを避けているようです。
フランクハレル2017年

2
@FrankHarrellさて、スプラインモデルに基づいてU形状のp値を思いつくのは(できれば)難しいと思います。多くの場合、良いスプラインモデルを作成し、それを目視してU形状の形跡があるかどうかを確認するだけで十分だと思います。とにかく、p値は好きではありません。それで結構です。しかし、このホワイトペーパーでは、U字形のp値を計算したい研究者のための手段を開発しようとしています。そして、この楽器は、回帰の二次項のように明らかにばかげた偽陽性率を持つべきではありません...少なくともそれは私の理解です。
amoeba

3
彼の主張が強いとは思えない。スプラインがフィットする可能性が高くなります。なぜバイリニアで停止するか、それを真剣に提示するのですか?スプラインを使用すると、関連付け(平坦性)と非線形性のテストは簡単です。非単調性のテストは課題です。その上で参照を参照したいと思います。非線形性のテストだけについて(ただし、予測の精度は無視)、二次関数はかなりまともな仕事をします。2行法は、不連続点を配置する場所に大きく依存します。
フランクハレル2017年

3
ベイジアンモデリングは大好きですが、変化点を想像するという思考実験が最も簡単な方法だとは思いません。非単調性の程度については、事前分布を使用した柔軟で滑らかなフィットが望ましいと思います。
フランクハレル2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.