リスト内の一意の値を数える方法

126

したがって、ユーザーに入力を求め、値を配列/リストに格納するこのプログラムを作成しようとしています。
次に、空白行が入力されると、それらの値のうちいくつが一意であるかがユーザーに通知されます。
私はこれを問題セットとしてではなく、実際の理由で構築しています。

enter: happy
enter: rofl
enter: happy
enter: mpg8
enter: Cpp
enter: Cpp
enter:
There are 4 unique words!

私のコードは次のとおりです：

# ask for input
ipta = raw_input("Word: ")

# create list 
uniquewords = [] 
counter = 0
uniquewords.append(ipta)

a = 0   # loop thingy
# while loop to ask for input and append in list
while ipta: 
  ipta = raw_input("Word: ")
  new_words.append(input1)
  counter = counter + 1

for p in uniquewords:

..そして、これが私がこれまでに得たすべてのことです。
リスト内の単語の一意の数を数える方法がわかりませんか？
誰かがソリューションを投稿して、それから私がそれを学ぶことができるか、少なくともそれがどのように素晴らしいかを私に示すことができれば、ありがとう！

— ジョエル・アク
ソース

4

あなたのコードサンプルのインデントを修正できますか？それはPythonで重要です！

— コードボックス

1

読みやすくするために編集するのではなく、コードを削除しました！そこにコードがあると、とても

— 役に立ち

1

@codebox申し訳ありません

— Joel Aqu。

243

さらに、collections.Counterを使用してコードをリファクタリングします。

from collections import Counter

words = ['a', 'b', 'c', 'a']

Counter(words).keys() # equals to list(set(words))
Counter(words).values() # counts the elements' frequency

出力：

['a', 'c', 'b']
[2, 1, 1]

— ビドゥル
ソース

46

ジョエルの質問に対する答えではありませんが、まさに私が探していたものに感謝します！

— Huw Walters

完璧です。そして雄牛の目。ありがとう@Vidul

— Parag Tyagi

Counter(words).values()いいです。カウントは単語リストの最初の出現順であると想定していますか？私が意味する、私は...その後、D、C、その後、Bそして、カウントは私たちの数を与えると仮定しています

— モニカHeddneck

219

セットを使用して重複を削除し、次にlen関数を使用してセット内の要素をカウントできます。

len(set(new_words))

— コードボックス
ソース

37

values, counts = np.unique(words, return_counts=True)

— ジェームス・ハースホーン
ソース

16

セットを使用：

words = ['a', 'b', 'c', 'a']
unique_words = set(words)             # == set(['a', 'b', 'c'])
unique_word_count = len(unique_words) # == 3

これで武装して、あなたの解決策は次のように簡単になるでしょう：

words = []
ipta = raw_input("Word: ")

while ipta:
  words.append(ipta)
  ipta = raw_input("Word: ")

unique_word_count = len(set(words))

print "There are %d unique words!" % unique_word_count

— ライナス・ティエル
ソース

6

aa="XXYYYSBAA"
bb=dict(zip(list(aa),[list(aa).count(i) for i in list(aa)]))
print(bb)
# output:
# {'X': 2, 'Y': 3, 'S': 1, 'B': 1, 'A': 2}

— マッドジェイホーク
ソース

1

これが他の回答とどのように異なるか説明してください

— Akaisteph7

4

ndarrayには、uniqueというユニークなメソッドがあります。

np.unique(array_name)

例：

>>> np.unique([1, 1, 2, 2, 3, 3])
array([1, 2, 3])
>>> a = np.array([[1, 1], [2, 3]])
>>> np.unique(a)
array([1, 2, 3])

シリーズの場合、関数呼び出しvalue_counts（）があります。

Series_name.value_counts()

— user78692
ソース

1

ipta = raw_input("Word: ") ## asks for input
words = [] ## creates list
unique_words = set(words)

— ユーザー1590499
ソース

1

セットが最も簡単な方法ですが、dictを使用some_dict.has(key)して、一意のキーと値のみを辞書に入力することもできます。

words[]ユーザーからの入力がすでに入力されていると想定して、リスト内の一意の単語を数値にマッピングするdictを作成します。

word_map = {}
i = 1
for j in range(len(words)):
    if not word_map.has_key(words[j]):
        word_map[words[j]] = i
        i += 1                                                             
num_unique_words = len(new_map) # or num_unique_words = i, however you prefer

— JMB
ソース

1

パンダを使用する他の方法

import pandas as pd

LIST = ["a","a","c","a","a","v","d"]
counts,values = pd.Series(LIST).value_counts().values, pd.Series(LIST).value_counts().index
df_results = pd.DataFrame(list(zip(values,counts)),columns=["value","count"])

その後、任意の形式で結果をエクスポートできます

— HazimoRa3d
ソース

1

どうですか：

import pandas as pd
#List with all words
words=[]

#Code for adding words
words.append('test')


#When Input equals blank:
pd.Series(words).nunique()

リストにある一意の値の数を返します

— john_data
ソース

StackOverflowへようこそ！このソリューションはpandasフレームワークの使用を想定しているようです。それは他のユーザーには不明確かもしれないので、答えでそれを言及する方が良いでしょう。

— Sergey Shubin

0

以下はうまくいくはずです。ラムダ関数は、重複する単語を除外します。

inputs=[]
input = raw_input("Word: ").strip()
while input:
    inputs.append(input)
    input = raw_input("Word: ").strip()
uniques=reduce(lambda x,y: ((y in x) and x) or x+[y], inputs, [])
print 'There are', len(uniques), 'unique words'

— ジョン・ワン
ソース

0

私は自分でセットを使用しますが、別の方法を次に示します。

uniquewords = []
while True:
    ipta = raw_input("Word: ")
    if ipta == "":
        break
    if not ipta in uniquewords:
        uniquewords.append(ipta)
print "There are", len(uniquewords), "unique words!"

— ニコラ・ムサッティ
ソース

0

ipta = raw_input("Word: ") ## asks for input
words = [] ## creates list

while ipta: ## while loop to ask for input and append in list
  words.append(ipta)
  ipta = raw_input("Word: ")
  words.append(ipta)
#Create a set, sets do not have repeats
unique_words = set(words)

print "There are " +  str(len(unique_words)) + " unique words!"

— 奇妙な
ソース