人口統計データに基づいて患者を照合する場合、患者が「同じ患者」になるためにどのフィールドを照合すべきかについての推奨事項はありますか?
実装によってアルゴリズムが異なることはわかっていますが、このプロセスに関するベストプラクティスや推奨事項があるかどうかは知りたいです。
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
等?
人口統計データに基づいて患者を照合する場合、患者が「同じ患者」になるためにどのフィールドを照合すべきかについての推奨事項はありますか?
実装によってアルゴリズムが異なることはわかっていますが、このプロセスに関するベストプラクティスや推奨事項があるかどうかは知りたいです。
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
等?
回答:
あります、この偉大なエッセイ(スペイン語で、申し訳ありません)2006年から医療ITに取り組んできましたし、彼はこれを行うためのアルゴリズムを記述するためのフィールド、といくつかの素晴らしい貢献をしてきましたパブロPazos、ウルグアイからCSエンジニアによって書かれたが。
翻訳者を通して記事を実行できますが、その要点は、人の身元を判断するための基本情報は、与えられた姓と姓(父と母の両方)、性別、生年月日であるということです。興味深いことに、「あらゆる種類の識別子はアイデンティティの一部ではない」ため、彼はSSNなどのID番号をアイデンティティマッチングアルゴリズムから明確に除外しています(ただし、この点は議論の余地があると思います)。また、彼は住所、電話番号などの属性を除外します。これらの属性は実際には誰かの身元とは関係がなく、「実際に誰か」とは関連付けられていないためです。
また、次のように、以前の属性のそれぞれに異なる「重み」を割り当てます。
これらの属性のすべてで一致が見つかったため、レコード間の比較が可能な複合「一致一致インデックス」を取得する方法を説明しています。また、Levenshtein's distanceのようなアルゴリズムを使用することにより、名前属性の「部分的な」一致が可能です。
よく読んで、IMO。申し訳ありませんがスペイン語ですが、その主なアイデアを伝えることができたと思います。
患者をマッチングするための魔法のアルゴリズムは1つもありません。
手始めに、地域的な違いがあります。MMattoliが指摘したように、米国の都市部の病院でうまく機能するものは、おそらくアボリジニを治療するオーストラリアの田舎の診療所にはうまく適合しないでしょう。
また、個々のサイトでは、フォールトトレランスに関する見解が異なります。確実に一致した場合にのみ一致した場合、多くの不一致が発生します。これにより、患者記録が重複し、他の一連の問題が発生します。ほとんどのサイトは、かなり確実に解決することをいとわないでしょうが、十分に確実なのはどのくらいですか?10人に尋ねると、12の回答が得られます。
したがって、「最適な」アルゴリズムは構成可能であるため、顧客はニーズに合わせて調整できます。
一致を検討する場合、フィールドごとに信頼度が異なります。
ヘルスケア固有の識別子は、その全体の目的がヘルスシステム内で個人を一意に識別することであるため、最も信頼できます。病院は通常、これらが重複しないように苦労します。
例:
システムによっては、他の患者ID も高い信頼性を提供する場合があります。たとえば、軍事IDは軍事病院でおそらく非常に重要です。
例:
一意の識別子がない場合、人口統計情報に頼らなければなりません。いずれか1つのフィールドで一致することはお勧めしませんが、より人口統計学的なフィールド一致があればあるほど、一致の信頼性が高まります。
頻繁に変化しない人についての事柄は、マッチングに適しています。
しかし、より柔軟な情報を試合で検討して、自信を高めることができます。
これらは頻繁に変更されるため、以前の姓も確認する価値があります。
あなたの質問で与えられた次の3つの明らかな組み合わせは別として
First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code
phone number (Home and/or Cell)
リストに追加することを考えます。最近では非常に一般的であり、すべてに一意の番号が付けられます。電話番号を変更した場合でも、ほとんどの人は古い電話番号を覚えているので便利です。
特に、人々が現地の言語を使用し、患者管理ソフトウェアがまだ「英語」を使用しているインドのような国では、アドレスが複数のスペルと複数のレンダリング方法に苦しむことがわかりました。
私の考えは以下の順序です1)。SSN、姓、および名の最初の5文字2)。SSN、生年月日、名の最初の5文字3)。SSN、生年月日、姓4)。SSN、性別、生年月日5)。姓、名、都市、および郵便番号の最初の5文字
これは米国では本当に難しい問題です。名前は一意ではなく、多くの場合、人の一生の間に変化するか、異なる方法で表示されます(たとえば、ロブとロバート)。健康保険番号とプロバイダーは頻繁に変更され、家族の複数のメンバーで同じになる場合があります。SSNはおそらくユニークですが、周囲に詐欺があります。もちろん、誰もが持っているわけではないドライバーのライセンス番号と同じです。
個人的には、保険証券番号と生年月日と名前の組み合わせから始め、次にssnと生年月日と名前の組み合わせから始めます。住所と電話番号を確認して、一致する場合は追加の保証を提供しますが、一致しない場合はそれほど重くはしません。さらに、血液型が変わらない場合は、血液型を除外要因として使用します(病院の吸血鬼が血液サンプルを採取することを知っています)。名前の一致は、名前のばらつきの問題のためにあいまい一致である必要があります。他の事柄は一般に、名前の信頼度が本当に高い場合(SSNに入る入力ミスである可能性がある場合)、最初に完全一致を検索する必要があります。