グループの列ごとに最後の非NULL値のセットを選択するにはどうすればよいですか?


9

SQL Server 2016を使用していますが、使用しているデータは次の形式です。

CREATE TABLE #tab (cat CHAR(1), t CHAR(2), val1 INT, val2 CHAR(1));

INSERT INTO #tab VALUES 
    ('A','Q1',2,NULL),('A','Q2',NULL,'P'),('A','Q3',1,NULL),('A','Q3',NULL,NULL),
    ('B','Q1',5,NULL),('B','Q2',NULL,'P'),('B','Q3',NULL,'C'),('B','Q3',10,NULL);

SELECT *
FROM    #tab;

ここに画像の説明を入力してください

列の最後のnull以外の値を取得し、val1val2グループ化catおよび順序付けしたいのtですが。私が求めている結果は

cat  val1 val2
A    1    P
B    10   C

私が来た最も近いものは、順序付けられた最後の非null値が必要なので、機能しないものLAST_VALUEを無視しながら使用してORDER BYいます。

SELECT DISTINCT 
        cat, 
        LAST_VALUE(val1) OVER(PARTITION BY cat ORDER BY (SELECT NULL) ) AS val1,
        LAST_VALUE(val2) OVER(PARTITION BY cat ORDER BY (SELECT NULL) ) AS val2
FROM    #tab
cat  val1 val2
A    NULL NULL
B    10   NULL

実際のテーブルにはcat、最後のnull以外の値を選択するための(日付列と文字列列)の列が多く、val列(日付列、文字列列、数値列)があります。

この選択を行う方法のアイデア。


1
@Véraceでグループ化さcatれていtます。
エドモンド

1
@ypercubeᵀᴹいいえ、Q4値の欠落はありませんt。値が繰り返されます。正常に動作しないデータです。
エドモンド

4
その場合は問題ありませんが、完全な順序を決定する順序を指定する必要があります。PARTITION BY cat ORDER BY t, id例えば。そうしないと、同じクエリ(どのクエリでも)を実行すると、結果が異なる場合があります。テーブルの列が表示するものだけである場合、どのように確定的な順序を設定できるかわかりません!
ypercubeᵀᴹ

1
@ypercubeᵀᴹそこに課題があります。データにid列がありません。複数のグループ化列があり、グループ内での順序付けに使用できる文字列列があり、次にnullが散在する複数の値列があります。
エドモンド

1
SQL Serverに行の順序を決定的に指示できない場合、このデータのコンシューマーはどのように違いを知るのでしょうか。
アーロンバートランド

回答:


10

Itzik Ben GanによるThe Last non NULL Puzzleの連結手法を使用すると、サンプルのテーブルと列のデータ型では次のようになります。

select T.cat,
       cast(substring(
                     max(cast(T.t as binary(2)) + cast(T.val1 as binary(4))),
                     3,
                     4
                     ) as int),
       cast(substring(
                     max(cast(T.t as binary(2)) + cast(T.val2 as binary(1))),
                     3,
                     1
                     ) as char(1))
from #tab as T
group by T.cat;

ここに画像の説明を入力してください

ステップをCTEに分割するこのクエリを記述する別の方法は、おそらく何が起こっているかをよりよく示すためです。上記のクエリとまったく同じ実行プランを提供します。

with C1 as
(
  -- Concatenate the ordering column with the value column
  select T.cat,
        cast(T.t as binary(2)) + cast(T.val1 as binary(4)) as val1,
        cast(T.t as binary(2)) + cast(T.val2 as binary(1)) as val2
  from #tab as T
),
C2 as
(
  -- Get the max concatenated value per group
  select C1.cat,
         max(C1.val1) as val1,
         max(C1.val2) as val2
  from C1
  group by C1.cat
)
-- Extract the value from the concatenated column
select C2.cat,
       cast(substring(C2.val1, 3, 4) as int) as val1,
       cast(substring(C2.val2, 3, 1) as char(1)) as val2
from C2;

このソリューションでは、null値を何かと連結するとnull値になるという事実を利用しています。SET CONCAT_NULL_YIELDS_NULL(Transact-SQL)


非常によく蒸留されたミカエル。この解決策は私を何度も救ってくれましたが、最初はItzikの記事の終わりで混乱を招きました。その点で彼は「ステップ2」とラベルを付けましたが、実際にはステップ1の背後にあるロジックを実装するようなものでした
pimbrouwers

2

パーティションにNULLのチェックを追加するだけです

SELECT DISTINCT 
        cat, 
        FIRST_VALUE(val1) OVER(PARTITION BY cat ORDER BY CASE WHEN val1 is NULL then 0 else 1 END DESC, t desc) AS val1,
        FIRST_VALUE(val2) OVER(PARTITION BY cat ORDER BY CASE WHEN val2 is NULL then 0 else 1 END DESC, t desc) AS val2
FROM    #tab

0

これでうまくいくはずです。row_number()と結合

適切な種類がない場合は、Q3の1つだけがnullでないことを期待する必要があります。

declare @t TABLE (cat CHAR(1), t CHAR(2), val1 INT, val2 CHAR(1));
INSERT INTO @t VALUES 
    ('A','Q1',2,NULL),('A','Q2',NULL,'P'),('A','Q3',1,NULL),('A','Q3',NULL,NULL),
    ('B','Q1',5,NULL),('B','Q2',NULL,'P'),('B','Q3',NULL,'C'),('B','Q3',10,NULL);

--SELECT *
--     , row_number() over (partition by cat order by t) as rn
--FROM   @t
--where val1 is not null or val2 is not null;

select t1.cat, t1.val1, t2.val2 
from  ( SELECT t.cat, t.val1
             , row_number() over (partition by cat order by t desc) as rn
        FROM   @t t
        where val1 is not null 
       ) t1
join   ( SELECT t.cat, t.val2
             , row_number() over (partition by cat order by t desc) as rn
        FROM   @t t
        where val2 is not null 
       ) t2
   on t1.cat = t2.cat
  and t1.rn = 1
  and t2.rn = 1
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.