リストからランダムに50項目を選択してファイルに書き込みます


129

これまでのところ、ファイルをインポートし、新しいファイルを作成し、リストをランダム化する方法を理解しました。

リストからランダムに50アイテムのみをランダムに選択してファイルに書き込むのに問題がありますか?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

したがって、ランダム化ファイルの合計が

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

最初のランダムセットが3、2番目のランダムセットが3、3番目のランダムセットが3の3つのファイル(out_file1 | 2 | 3)が必要です(この例では、作成するファイルには50が必要です)。

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

したがって、最後の「4」は含まれませんが、問題ありません。

ランダム化したリストから50を選択するにはどうすればよいですか?

さらに、元のリストからランダムに50を選択するにはどうすればよいですか?


どういう意味ですか?
O.rka 2016年

回答:


269

リストがランダムな順序になっている場合は、最初の50だけを取ることができます。

それ以外の場合は、

import random
random.sample(the_list, 50)

random.sample ヘルプテキスト:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)

1
random.sampleそれが選択したインデックスも返すことができますか?
zyy

43

ランダムなアイテムを選択する簡単な方法の1つは、シャッフルしてからスライスすることです。

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables

@MonicaHeddneckランダムシャッフルとスライスが優れているのはなぜですか?選択をランダム化して多数のサンプルを選択することには、ランダムシャッフルしてからシャッフルされたサンプルのスライスを取得することと同じメリットがありますか?説明していただけますか?ありがとう。
salvu 2017

7
これを使用して、機械学習プロジェクトのテスト/トレーニングセットを簡単に作成しました。を使用してもrandom.choice(mylist,3)、このように2つのばらばらのセットは作成されません。
モニカヘドネック2017

29

random.choice()はより良いオプションだと思います。

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

この関数は、リストからランダムに選択された3つの値の配列を返します


7
使う必要があると思いますrandom.choice(mylist, 3, replace=False)。また、あまり使用する混乱import numpy as npnp.random.choice(mylist, 3, replace=False)
ジョン・ラRooy

10
これは、リストアイテムを繰り返す可能性があります
Paullo

いいえ、これは良いオプションではありません。100倍遅くなります
nitesh kansal

-3

リストに100個の要素があり、ランダムに50個を選択するとします。以下はその手順です。

  1. ライブラリをインポートする
  2. 乱数ジェネレータのシードを作成し、2に設定しました
  3. ランダムにピックアップする番号のリストを準備する
  4. 番号リストからランダムに選択してください

コード:

from random import seed
from random import choice

seed(2)
numbers = [i for i in range(100)]

print(numbers)

for _ in range(50):
    selection = choice(numbers)
    print(selection)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.