これは古い質問ですが、以前の回答のいずれも、実際の問題、つまり問題が質問自体にあるという事実に対処していません。
最初に、確率が既に計算されている場合、つまりヒストグラムの集計データが正規化された方法で利用できる場合、確率は1まで増えるはずです。明らかにそうではありません。これは、用語またはデータのいずれかで問題が発生していることを意味しますまたは質問の仕方で。
第2に、ラベルが(間隔ではなく)提供されているという事実は、通常、確率がカテゴリカル応答変数であることを意味します-ヒストグラムをプロットするためのバープロットの使用が最適です(またはpyplotのhistメソッドのハッキングが最適です)。 Shayan Shafiqの答えはコードを提供します。
ただし、問題1を参照してください。これらの確率は正しくありません。この場合、「ヒストグラム」は単変量分布のストーリーを伝えないため、何らかの理由で(クラスが重複しており、観測値が複数カウントされている可能性があるため)棒グラフを使用すると間違っています。この場合、そのようなプロットはヒストグラムと呼ばれるべきではありません。
ヒストグラムは、定義上、単変量変数の分布のグラフィカル表現です(https://www.itl.nist.gov/div898/handbook/eda/section3/histogra.htm、https://en.wikipedia.org/wikiを参照) /ヒストグラム)そして、関心のある変数の選択されたクラスにおける観測のカウントまたは頻度を表すサイズのバーを描画することによって作成されます。変数が連続スケールで測定される場合、これらのクラスはビン(間隔)です。ヒストグラム作成手順の重要な部分は、カテゴリ変数の応答のカテゴリをグループ化する(またはグループ化せずに維持する)方法、または可能な値のドメインを間隔に分割する方法(ビンの境界を配置する場所)を連続的に選択することです。タイプ変数。すべての観測は表現されるべきであり、各観測はプロットで一度だけです。つまり、バーのサイズの合計は観測値の合計数(または可変幅の場合はそれらの面積、これはあまり一般的ではないアプローチ)と等しくなければなりません。または、ヒストグラムが正規化されている場合、すべての確率の合計が1になる必要があります。
データ自体が応答としての「確率」のリストである場合、つまり観測値が研究の各オブジェクトの(何かの)確率値である場合、最良の答えは単にplt.hist(probability)
ビニングオプションであり、すでに利用可能なxラベルの使用は疑わしい。
次に、棒グラフをヒストグラムとして使用するのではなく、単に
import matplotlib.pyplot as plt
probability = [0.3602150537634409, 0.42028985507246375,
0.373117033603708, 0.36813186813186816, 0.32517482517482516,
0.4175257731958763, 0.41025641025641024, 0.39408866995073893,
0.4143222506393862, 0.34, 0.391025641025641, 0.3130841121495327,
0.35398230088495575]
plt.hist(probability)
plt.show()
結果とともに
そのような場合のmatplotlibは、デフォルトで次のヒストグラム値とともに到着します
(array([1., 1., 1., 1., 1., 2., 0., 2., 0., 4.]),
array([0.31308411, 0.32380469, 0.33452526, 0.34524584, 0.35596641,
0.36668698, 0.37740756, 0.38812813, 0.39884871, 0.40956928,
0.42028986]),
<a list of 10 Patch objects>)
結果は配列のタプルです。最初の配列には観測カウントが含まれます。つまり、プロットのy軸に対して表示されるもの(合計で13、観測の総数)で、2番目の配列はxの区間境界です-軸。
それらが等間隔に配置されていることを確認できます。
x = plt.hist(probability)[1]
for left, right in zip(x[:-1], x[1:]):
print(left, right, right-left)
または、たとえば3つのビン(13の観測に対する私の判断の呼び出し)の場合、このヒストグラムを取得します。
plt.hist(probability, bins=3)
「棒の後ろ」のプロットデータは
質問の著者は、値の「確率」リストの意味が何であるかを明確にする必要があります-「確率」は、応答変数の名前です(そして、ヒストグラムにxラベルが用意されているのはなぜですか、意味がありません) )、またはデータから計算された確率のリスト値です(合計が1にならないという事実は意味がありません)。