Oracleのテーブルで重複する値を見つけるにはどうすればよいですか?


276

指定された列の重複値とOracleデータベーステーブルでのそれらの発生数を返す最も簡単なSQLステートメントは何ですか?

たとえばJOBS、次のような列を持つテーブルがありますJOB_NUMBERJOB_NUMBER重複するがあるかどうか、および重複する回数を確認するにはどうすればよいですか?


回答:


608
SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;

1
ありがとう-それが私が見つけた答えであり、あなたはそれをここに投稿するために私を倒しました!:o)
Andrew

3
どういたしまして。count(column)とcount(*)の違いについての質問を投稿しようとしています。:)
リザード

44
+1 4年以上の後、依然としてうまく機能し、そしてそれらはでもある限り、複数の列を選択するために調整することができるgroup byと同様に、:select column_one, column_two, count(*) from tablename group by column_one, column_two having count(column_one) > 1;など
アモスM.カーペンター

4
あるいはhaving count(*) > 1:D
スタニスラフMamontov

3
8年以上後の+1でも、OracleとMySQLの最新バージョンの両方で引き続き正常に機能します(行がある場合は、count関数の後にスペースを削除してください)。
PhatHV 2016

58

別の方法:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

にインデックスがある場合、正常に動作します(十分な速さ)column_name。また、重複する行を削除または更新するためのより良い方法です。


3
+1は複数列の重複に対して適切に機能します(たとえば、複数の列にUNIQUE制約を追加する場合)、このアプローチは、必要に応じて重複フィールド値+他のフィールドをリストするGROUP BYの1つよりも「厳密」ではないことがわかりました。
Frosty Z

3
明確にするために(これは私には最初は明らかではありませんでした)このクエリは重複のみを返します。最初の元のエントリは返されません。そのため、重複を削除するのに適しています。 1列。このクエリで重複するIDを選択し、それらを使用して重複を削除できます。
matthewb 2012年

1
<を!=に変更すると、重複するすべてのレコードが取得されます。2番目または3番目のレコードだけでなく
moore1emu


17

重複の実際の数を知る必要がない場合は、返される列に数を含める必要はありません。例えば

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

7

どうですか:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

上記の例に答えると、次のようになります。

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

5

複数の列が一意の行を識別する場合(例:Relations table)、以下を使用できます

行IDを使用(例:emp_dept(empid、deptid、startdate、enddate))empidとdeptidが一意であり、その場合に行を識別すると仮定

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

そのようなテーブルに主キーがある場合、ROWIDの代わりに主キーを使用します。たとえば、IDはpkです。

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

4

している

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

重複した行のIDを取得します。


4
SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 

2

私は通常、Oracle Analytic関数ROW_NUMBER()を使用します

(あなたは一意のインデックスまたは列の上に構築された主キーについている重複を確認したいと言いますc1c2c3)。その後、育て、この道を行くだろうROWIDによってもたらされる行数は、行のS ROW_NUMBER()です>1

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)


1

私はその古いスレッドを知っていますが、これはいくつかの助けになるかもしれません。

以下の重複使用を確認しながらテーブルの他の列を印刷する必要がある場合:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

必要に応じて、where句にフィルタを追加することもできます。


0

1.ソリューション

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

このオリジナルのポスターは削除については言及せず、数えるだけでした
Jeff

-1

また、あなたはこのようなことを試して、テーブル内のすべての重複値をリストすることができますreqitemと言う

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.