要素番号付きのPostgreSQLunnest()


90

値が分離された列がある場合、次のunnest()関数を使用できます。

myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id, unnest(string_to_array(elements, ',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

要素番号を含めるにはどうすればよいですか?すなわち:

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

ソース文字列内の各要素の元の位置が必要です。私は、ウィンドウ関数(と試してみたrow_number()rank()など)が、私は常に取得します1。おそらく、それらがソーステーブルの同じ行にあるためですか?

私はそれが悪いテーブルデザインであることを知っています。それは私のものではありません、私はそれを修正しようとしています。

回答:


184

Postgres9.4以降

WITH ORDINALITYセットを返す関数に使用します。

FROM句内の関数に接尾辞が付いているWITH ORDINALITY場合、bigint1から始まり、関数の出力の各行ごとに1ずつ増加する 列が出力に追加されます。これは、などの集合戻り関数の場合に最も役立ちunnest()ます。

LATERAL9.3ページ以降機能と組み合わせて、pgsql-hackersのこのスレッドによると、上記のクエリは次のように記述できます。

SELECT t.id, a.elem, a.nr
FROM   tbl AS t
LEFT   JOIN LATERAL unnest(string_to_array(t.elements, ','))
                    WITH ORDINALITY AS a(elem, nr) ON TRUE;

LEFT JOIN ... ON TRUE右側のテーブル式が行を返さない場合でも、左側のテーブルのすべての行を保持します。それが問題にならない場合は、これと同等の、冗長性の少ない形式を暗黙的に使用できますCROSS JOIN LATERAL

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);

または、実際の配列arr配列列)に基づいている場合はより簡単です:

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);

または、最小限の構文で:

SELECT id, a, ordinality
FROM   tbl, unnest(arr) WITH ORDINALITY a;

a自動的にテーブル列のエイリアスです。追加された通常の列のデフォルト名はordinalityです。ただし、明示的な列エイリアスとテーブル修飾列を追加することをお勧めします(より安全でクリーンです)。

Postgres 8.4-9.3

ではrow_number() OVER (PARTITION BY id ORDER BY elem)あなたはソート順、ではないの序数に応じて番号を取得し、元の順序位置の文字列インチ

あなたは単に省略できますORDER BY

SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;

これは正常に機能し、単純なクエリで失敗するのを見たことがありませんが、PostgreSQLはORDER BY。なしの行の順序に関して何も主張しません。実装の詳細により、たまたま機能します。

空白で区切られた文字列の要素の序数保証するには:

SELECT id, arr[nr] AS elem, nr
FROM  (
   SELECT *, generate_subscripts(arr, 1) AS nr
   FROM  (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
   ) sub;

または、実際の配列に基づいている場合はより簡単です:

SELECT id, arr[nr] AS elem, nr
FROM  (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;

dba.SEに関する関連回答:

Postgres 8.1-8.4

これらの機能のいずれも使用できません、まだ:RETURNS TABLEgenerate_subscripts()unnest()array_length()。しかし、これは機能します:

CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

特に、配列インデックスは要素の順序位置とは異なる場合があることに注意してください。拡張機能を備えたこのデモを検討してください。

CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

SELECT id, arr, (rec).*
FROM  (
   SELECT *, f_unnest_ord_idx(arr) AS rec
   FROM  (VALUES (1, '{a,b,c}'::text[])  --  short for: '[1:3]={a,b,c}'
               , (2, '[5:7]={a,b,c}')
               , (3, '[-9:-7]={a,b,c}')
      ) t(id, arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,b,c}         | a   |          1 |   1
  1 | {a,b,c}         | b   |          2 |   2
  1 | {a,b,c}         | c   |          3 |   3
  2 | [5:7]={a,b,c}   | a   |          1 |   5
  2 | [5:7]={a,b,c}   | b   |          2 |   6
  2 | [5:7]={a,b,c}   | c   |          3 |   7
  3 | [-9:-7]={a,b,c} | a   |          1 |  -9
  3 | [-9:-7]={a,b,c} | b   |          2 |  -8
  3 | [-9:-7]={a,b,c} | c   |          3 |  -7

比較:


10
この回答は、PostgreSQLに関してSOで最も包括的な回答の1つです。アーウィンに感謝します。
アレクサンドロス

新しいpgバージョンで、以下のunnest2関数を(偽の行ではなく)実際のテーブルリターンに適合させることはできますか?
ピータークラウス2015

@ erwin-brandstetter、なぜ/もしWITH ORDINALITYが優先されるのgenerate_subscripts()か、詳しく説明していただけますか?generate_subscripts()配列内の実際の要素の位置を示しているので、私には良いように見えます。これは、たとえば、配列を更新するときに役立ちます...WITH ORDINALITY代わりに使用する必要がありますか?
ロストホース2015年

1
@losthorse:私はこのようにそれを概説します:WITH ORDINALITYの行番号を取得するための一般的な解決策である任意のSQLクエリ内の関数を返すセットが。これは最も高速で信頼性の高い方法であり、1次元の1ベースの配列でも完全に機能します(Postgres配列のデフォルト。これを考慮してください)。場合あなたは、配列の他の種類(ほとんどの人がいない)と連携し、あなたが実際にオリジナルの添字で/仕事を維持する必要がある、そしてgenerate_subscripts()移動するための方法です。しかしunnest()、最初はすべてを平坦化します...
Erwin Brandstetter 2015年

1
@ z0r_マニュアル: Table functions appearing in FROM can also be preceded by the key word LATERAL, but for functions the key word is optional; the function's arguments can contain references to columns provided by preceding FROM items in any case.
Erwin Brandstetter 2015年

9

試してみてください:

select v.*, row_number() over (partition by id order by elem) rn from
(select
    id,
    unnest(string_to_array(elements, ',')) AS elem
 from myTable) v

6

添え字生成関数を使用します。
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS

例えば:

SELECT 
  id
  , elements[i] AS elem
  , i AS nr
FROM
  ( SELECT 
      id
      , elements
      , generate_subscripts(elements, 1) AS i
    FROM
      ( SELECT
          id
          , string_to_array(elements, ',') AS elements
        FROM
          myTable
      ) AS foo
  ) bar
;

もっと簡単に:

SELECT
  id
  , unnest(elements) AS elem
  , generate_subscripts(elements, 1) AS nr
FROM
  ( SELECT
      id
      , string_to_array(elements, ',') AS elements
    FROM
      myTable
  ) AS foo
;

3

要素の順序が重要でない場合は、次のことができます

select 
  id, elem, row_number() over (partition by id) as nr
from (
  select
      id,
      unnest(string_to_array(elements, ',')) AS elem
  from myTable
) a

0

unnest2() 運動として

pg v8.4より前の古いバージョンには、ユーザー定義が必要unnest()です。この古い関数を適応させて、インデックスを持つ要素を返すことができます。

CREATE FUNCTION unnest2(anyarray)
  RETURNS setof record  AS
$BODY$
  SELECT $1[i], i
  FROM   generate_series(array_lower($1,1),
                         array_upper($1,1)) i;
$BODY$ LANGUAGE sql IMMUTABLE;

2
RETURNS TABLEまだないため、これはpgv8.4より前では機能しません。解決策について説明する章を回答に追加しました。
Erwin Brandstetter 2016

1
@ErwinBrandstetter、あなたの答えは非常に教訓的で、4年前のテキストを磨いています(!)... SOテキストを使用してPostgreSQLの本を書いていますか?:-)
Peter Krauss

みなさん、こんにちは。Wikiです。編集できます(!)...でも、わかりましたsetof record。に修正しました。
ピータークラウス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.