「ラプラスノイズ」とはどういう意味ですか?


9

私は現在、Laplaceメカニズムを使用した差分プライバシーのアルゴリズムを書いています。

残念ながら、私は統計の背景がないので、多くの用語は私には知られていない。だから今、私はラプラスノイズという言葉につまずきました。データセットの差分を非公開にするには、すべての論文で、ラプラス分布に従ってラプラスノイズを関数値に追加する方法について説明します。

k(X)=f(X)+Y(X)

(kは微分プライベート値、fは評価関数による戻り値、Yはラプラスノイズ)

これは、ウィキペディアhttps://en.wikipedia.org/wiki/Laplace_distributionから持っているこの関数に従って、ラプラス分布からランダム変数を作成することを意味しますか?

Y=μb sgn(U)ln(12|U|)

更新:上記の関数から最大100個のランダム変数をプロットしましたが、これではラプラス分布が得られません(近いものではありません)。しかし、私はそれがラプラス分布をモデル化すべきだと思います。

UPDATE2:

それらは私が持っている定義です:

(ラプラスのメカニズム)。関数与えられると、ラプラスメカニズムは次のように定義されます:ここで、YはLap(∆f / \ epsilon)から抽出されたiid確率変数ですf:N|X|RkML(x,f(·),ϵ)=f(x)+(Y1,...,Yk)Lap(f/ϵ)

と同様:

Y(X)を生成するための一般的な選択は、平均がゼロでΔ(f)/εスケールパラメーターを持つラプラス分布を使用することです。


2番目の方程式は、PDFではなくCDFです。PDFからサンプリングしたい。これは、ラプラス(biexponential)ディストリビューション(docs.scipy.org/doc/numpy-1.9.3/reference/generated/…)からサンプリングするpythonコードです
Luca

1
「ラプラスノイズ」に言及している正確なリファレンスを提供できますか?私はそれらがrv YをXに追加することを意味していると思います。ここでYはラプラス分布に従います。更新については、この方法機能します-コードを間違えたに違いない、またはそれから100回しかドローを作成しなかったという事実であり、5000回以上試行すると、より多くの検索が開始されると思います "ラプラス」...
Tim

私のプロットは実際にはCDFのように見えると思います。コードと同様に、上で追加しました。ここでは引用符へのリンクです:1 2
ロッテ

以前に使用したコードも見たことがありますが、なぜこのような結果になるのかわかりません。プロットは私のコードを示しており、f = 1とeps = 1で1000回ループしましたが、私の主なポイントは、「ラプラスノイズ」を正しく理解していればです。どういうわけか私はワークアウトできるコード。
ロッテ

回答:


14

正解です。ラプラスノイズを追加すると、変数ラプラス分布に従う変数が追加されます。ノイズと呼ばれる理由はいくつかあります。まず、信号処理について考えてみます。メッセージはいくつかのチャネルを介して送信され、チャネルの不完全な性質により、受信した信号にはノイズが多いため、信号をノイズから分離する必要があります。第2に、暗号化では、疑似ランダムノイズについても説明します。差分プライバシーは暗号化に関連しています。3番目に、統計と機械学習では、統計的ノイズについても説明できます。統計モデルには、ノイズやエラーの項などが含まれます(名前の予測に関する本さえありますXYネイトシルバーによる信号とノイズ)。したがって、あいまいなランダム性のより正確な同義語としてノイズを使用します

ランダム生成については、ラプラス分布に従ってランダム値を描画する方法がいくつかあります。たとえば、次のような方法があります。

  1. 逆変換方法をWikipediaで説明しました:
f <- function(n) {
   u <- runif(n, -0.5, 0.5)
   sign(u)*log(1-2*abs(u))
}
  1. 場合及び指数分布に従う独立ランダム変数である、次にラプラス分布に従いますUVY=UV
g <- function(n) { rexp(n)-rexp(n) }
  1. ラプラス分布に従う場合指数分布従うので、Y|Y|
h <- function(n) { rexp(n)*sample(c(-1,1), n, replace = TRUE) }

以下のプロットでは、ラプラス密度(赤い線)を伴う各関数を使用して描かれたサンプルの分布を確認できます。105

ここに画像の説明を入力してください

例を簡略化するために、scale = 1の標準ラプラス分布を使用しますが、異なるスケーリング係数を使用して結果を乗算することにより、結果を簡単に変更できます。


ありがとう!それが私の質問の答えです。「ノイズ」という用語について本当に混乱し、適切な説明が見つかりませんでした。
ロッテ

私は自分のコードのヒストグラムをプロットしましたが、見た目は良いです:)
Lotte

2

ラプラスまたは二重指数分布は、いくつかの平均値の周囲で指数関数的に左右に減衰します。それは基本的に反対側にミラーリングされた指数です。

  • 尤度が必要な場合は、指数の尤度を使用して、観測値にabs()を追加します。対数尤度は、残差のabs()に指数関数の比率を掛けたものです。

  • サンプリングするには、最も簡単なのは、-1、1、およびほとんどのプログラミング言語で利用可能な指数分布からのドローを掛けることです。あるいは、上記のように、ラプラスの直接の実装も見つかりますが、少し検索が必要になる場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.