人口統計に基づいた信頼できる患者マッチングのために推奨される最小マッチング基準は何ですか?


30

人口統計データに基づいて患者を照合する場合、患者が「同じ患者」になるためにどのフィールドを照合すべきかについての推奨事項はありますか?

実装によってアルゴリズムが異なることはわかっていますが、このプロセスに関するベストプラクティスや推奨事項があるかどうかは知りたいです。

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

等?


4
おそらく、この質問に対する答えは、特定の国によって、あるいは民族的および文化的な考慮事項によっても変わる可能性があります。たとえば、オーストラリアの原住民にとっては、時間の経過とともに名前が変わる可能性があるため、人の名前は患者IDとしては適切ではありません(または、その場合はより低い「重み」を与える必要があります)。亡くなった人と同じ名前を持っているオーストラリアの原住民は、死んでいる人の同じ名前を運ぶのは非常に悪いと考えているため、それを放棄します。死者の名前がタブーである場合、他の文化でも同様のことが起こります。リンク

4
または、まだ発表されていない研究の別の例:米国へのフィリピン移民では、最も一般的な10名の姓が全人の約6%を占めています。ベトナム人移民では、彼らは約60%を占めています。フィリピン人の名前はベトナム人よりもはるかに優れた識別子です。その研究が利用可能になったら、必ず投稿します。

明確にするために:2つのレコードセットを一致させることが主な目的ですか?

レコードの一致を試みるときは、一致の強さ(「ボブ」は「ボブ」に非常に似ています)と可能な一致の数(多くのボブがいる)を区別してください。2つのレコードの名前が同じで、その名前のレコードが他にない場合、アドレスが異なっていても、おそらく同じ人物です。もちろん、大きなコーパスがあると仮定します。
すべての取引のジョン

回答:


20

あります、この偉大なエッセイ(スペイン語で、申し訳ありません)2006年から医療ITに取り組んできましたし、彼はこれを行うためのアルゴリズムを記述するためのフィールド、といくつかの素晴らしい貢献をしてきましたパブロPazos、ウルグアイからCSエンジニアによって書かれたが。

翻訳者を通して記事を実行できますが、その要点は、人の身元を判断するための基本情報は、与えられた姓と姓(父と母の両方)、性別、生年月日であるということです。興味深いことに、「あらゆる種類の識別子はアイデンティティの一部ではない」ため、彼はSSNなどのID番号をアイデンティティマッチングアルゴリズムから明確に除外しています(ただし、この点は議論の余地があると思います)。また、彼は住所、電話番号などの属性を除外します。これらの属性は実際には誰かの身元とは関係がなく、「実際に誰か」とは関連付けられていないためです。

また、次のように、以前の属性のそれぞれに異なる「重み」を割り当てます。

  • 名:17.5%
  • ミドルネーム:17.5%
  • 姓(父):17.5%
  • 姓(母):17.5%
  • セックス:10%
  • DOB:20%

これらの属性のすべてで一致が見つかったため、レコード間の比較が可能な複合「一致一致インデックス」を取得する方法を説明しています。また、Levenshtein's distanceのようなアルゴリズムを使用することにより、名前属性の「部分的な」一致が可能です

よく読んで、IMO。申し訳ありませんがスペイン語ですが、その主なアイデアを伝えることができたと思います。


2
これは素晴らしい、ありがとう。北米ではよくあるように、特に文化的背景の多様性が高いコミュニティでは、タイプミスが非常に一般的であるため、距離に言及するための+1。とは言っても、私が実行しなければならないインスタンスのほとんどは、可能な値のドメインと一致しますが、非常に制限されています。したがって、これらの場合、データベースで単一のヒットを返す信頼できる基準(健康保険番号など)で十分です。複数のエントリが返される場合は、ユーザーに問い合わせる(利用可能な場合)か、追加の基準でフィルターする傾向があります。

(... contd)ただし、これらのケースは、クリニックまたは病院へのEMRのローカルインストール、または放射線部門へのRISに適用されることに注意してください。これらの場合、顧客は診療所または病院に登録されているか、登録されていません。しかし、MPIの場合、これはまったく新しいボールゲームです。

13

患者をマッチングするための魔法のアルゴリズムは1つもありません。

手始めに、地域的な違いがあります。MMattoliが指摘したように、米国の都市部の病院でうまく機能するものは、おそらくアボリジニを治療するオーストラリアの田舎の診療所にはうまく適合しないでしょう。

また、個々のサイトでは、フォールトトレランスに関する見解が異なります。確実に一致した場合にのみ一致した場合、多くの不一致が発生します。これにより、患者記録が重複し、他の一連の問題が発生します。ほとんどのサイトは、かなり確実に解決することをいとわないでしょうが、十分に確実なのはどのくらいですか?10人に尋ねると、12の回答が得られます。

したがって、「最適な」アルゴリズムは構成可能であるため、顧客はニーズに合わせて調整できます。

一致を検討する場合、フィールドごとに信頼度が異なります。

ヘルスケア固有の識別子は、その全体の目的がヘルスシステム内で個人を一意に識別することであるため、最も信頼できます。病院は通常、これらが重複しないように苦労します。

例:

  • 国民健康ID(例:英国NHS番号)
  • 病院が割り当てた医療記録番号。

システムによっては、他の患者ID 高い信頼性を提供する場合があります。たとえば、軍事IDは軍事病院でおそらく非常に重要です。

例:

  • 軍事ID
  • 保険ID
  • 社会保障番号(米国では、保険詐欺がramp延しているため、一般に社会保障番号は信頼性の高い試合と見なされません。)

一意の識別子がない場合、人口統計情報に頼らなければなりません。いずれか1つのフィールドで一致することはお勧めしませんが、より人口統計学的なフィールド一致があればあるほど、一致の信頼性が高まります。

頻繁に変化しない人についての事柄は、マッチングに適しています。

  • 性別
  • 生年月日

しかし、より柔軟な情報を試合で検討して、自信を高めることができます。

  • 住所
  • 電話番号
  • 電子メールアドレス

3
また、SSNにはいくつかの非常に厳しい制限があります。たとえば、カナダでは、雇用主または銀行でない限り要求することは違法です(おそらく、私も弁護士ではありません)。中国のような他の場所では、交通量の多い休暇中に列車の切符を購入するためにさえ、ほとんどすべてにそれを使用しています。

女性の場合、名前の変更は一般的です。また、2人の人は同じ名前を持ち、同じ場所に住んでいることがよくあります(たとえば、父親の名前は息子です)。
HLGEM

@HLGEM:完全に正しいため、照合に単一の人口統計フィールドを使用しないでください。しかし、人々がそれに頼らなければならないとき、より静的なフィールド(それでも時々変化する)は、代替よりも信頼性があります。しかし、それは彼らを良くしません。
リン

7

これらは頻繁に変更されるため、以前の姓も確認する価値があります。


+1「頻繁に」は控えめな表現です。:)これは確かに、特定できない、または名前のない患者、新生児、誤認などの場合に当てはまります。多くのトランザクションがある環境では、名前はより難しくなりますが、より重要です。

4

あなたの質問で与えられた次の3つの明らかな組み合わせは別として

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

phone number (Home and/or Cell)リストに追加することを考えます。最近では非常に一般的であり、すべてに一意の番号が付けられます。電話番号を変更した場合でも、ほとんどの人は古い電話番号を覚えているので便利です。

特に、人々が現地の言語を使用し、患者管理ソフトウェアがまだ「英語」を使用しているインドのような国では、アドレスが複数のスペルと複数のレンダリング方法に苦しむことがわかりました。


3

レコード内の性別は、多くの場合、名から派生しているようです。私たちは名前から性別を導き出すことができないときに、外国人の性別の違いが増えているのを見てきました。

ドイツでは、「äöü」などの「Umlaute」を含む名前にいくつかの違いがありますが、「ae oe ue」に置き換えられることもあります。


1

私の考えは以下の順序です1)。SSN、姓、および名の最初の5文字2)。SSN、生年月日、名の最初の5文字3)。SSN、生年月日、姓4)。SSN、性別、生年月日5)。姓、名、都市、および郵便番号の最初の5文字


1

これは米国では本当に難しい問題です。名前は一意ではなく、多くの場合、人の一生の間に変化するか、異なる方法で表示されます(たとえば、ロブとロバート)。健康保険番号とプロバイダーは頻繁に変更され、家族の複数のメンバーで同じになる場合があります。SSNはおそらくユニークですが、周囲に詐欺があります。もちろん、誰もが持っているわけではないドライバーのライセンス番号と同じです。

個人的には、保険証券番号と生年月日と名前の組み合わせから始め、次にssnと生年月日と名前の組み合わせから始めます。住所と電話番号を確認して、一致する場合は追加の保証を提供しますが、一致しない場合はそれほど重くはしません。さらに、血液型が変わらない場合は、血液型を除外要因として使用します(病院の吸血鬼が血液サンプルを採取することを知っています)。名前の一致は、名前のばらつきの問題のためにあいまい一致である必要があります。他の事柄は一般に、名前の信頼度が本当に高い場合(SSNに入る入力ミスである可能性がある場合)、最初に完全一致を検索する必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.