測定単位を変換する


10

物質が異なる(ただし互換性のある)単位体積で与えられている物質のリストに最も適した測定単位を計算しようとしています。

単位換算表

単位変換テーブルには、さまざまな単位とそれらの単位の関係が格納されています。

id  unit          coefficient                 parent_id
36  "microlitre"  0.0000000010000000000000000 37
37  "millilitre"  0.0000010000000000000000000 5
 5  "centilitre"  0.0000100000000000000000000 18
18  "decilitre"   0.0001000000000000000000000 34
34  "litre"       0.0010000000000000000000000 19
19  "dekalitre"   0.0100000000000000000000000 29
29  "hectolitre"  0.1000000000000000000000000 33
33  "kilolitre"   1.0000000000000000000000000 35
35  "megalitre"   1000.0000000000000000000000 0

係数でソートすると、parent_id子ユニットが上位の数値にリンクされていることがわかります。

このテーブルは、PostgreSQLで以下を使用して作成できます。

CREATE TABLE unit_conversion (
  id serial NOT NULL, -- Primary key.
  unit text NOT NULL, -- Unit of measurement name.
  coefficient numeric(30,25) NOT NULL DEFAULT 0, -- Conversion value.
  parent_id integer NOT NULL DEFAULT 0, -- Relates units in order of increasing measurement volume.
  CONSTRAINT pk_unit_conversion PRIMARY KEY (id)
)

からparent_idへの外部キーが必要idです。

物質表

物質表は、物質の特定の量をリストします。例えば:

 id  unit          label     quantity
 1   "microlitre"  mercury   5
 2   "millilitre"  water     500
 3   "centilitre"  water     2
 4   "microlitre"  mercury   10
 5   "millilitre"  water     600

テーブルは次のようになります。

CREATE TABLE substance (
  id bigserial NOT NULL, -- Uniquely identifies this row.
  unit text NOT NULL, -- Foreign key to unit conversion.
  label text NOT NULL, -- Name of the substance.
  quantity numeric( 10, 4 ) NOT NULL, -- Amount of the substance.
  CONSTRAINT pk_substance PRIMARY KEY (id)
)

問題

整数(およびオプションで実数成分)を持つ最小の桁を使用して物質の合計を表す測定値を見つけるクエリをどのように作成しますか?

たとえば、次のように返します。

  quantity  unit        label
        15  microlitre  mercury 
       112  centilitre  water

だがしかし:

  quantity  unit        label
        15  microlitre  mercury 
      1.12  litre       water

112の実数は1.12よりも少なく、112は1120よりも小さいためです。ただし、1.1リットルと110センチメートルのように、実数を使用した方が短い場合があります。

ほとんどの場合、再帰的な関係に基づいて正しいユニットを選択するのに問題があります。

ソースコード

これまでのところ(明らかに非稼働):

-- Normalize the quantities
select
  sum( coefficient * quantity ) AS kilolitres
from
  unit_conversion uc,
  substance s
where
  uc.unit = s.unit
group by
  s.label

アイデア

これには、桁数を決定するためにログ10を使用する必要がありますか?

制約

ユニットはすべて10の累乗ではありません。例:http : //unitsofmeasure.org/ucum-essence.xml


3
@mustaccio非常に生産的なシステムで、前の場所とまったく同じ問題がありました。そこで、フードデリバリーキッチンで使用される量を計算する必要がありました。
dezso 2013年

2
少なくとも2つのレベルの再帰CTEを覚えています。私は最初に、与えられた物質のリストに現れた最小単位で合計を計算し、それをゼロ以外の整数部分を持つ最大単位に変換したと思います。
dezso 2013年

1
すべてのユニットは10の累乗で変換で​​きますか?ユニットのリストは完全ですか?
Erwin Brandstetter 2013

回答:


2

これは醜く見えます:

  with uu(unit, coefficient, u_ord) as (
    select
     unit, 
     coefficient,
     case 
      when log(u.coefficient) < 0 
      then floor (log(u.coefficient)) 
      else ceil(log(u.coefficient)) 
     end u_ord
    from
     unit_conversion u 
  ),
  norm (label, norm_qty) as (
   select
    s.label,
    sum( uc.coefficient * s.quantity ) AS norm_qty
  from
    unit_conversion uc,
    substance s
  where
    uc.unit = s.unit
  group by
    s.label
  ),
  norm_ord (label, norm_qty, log, ord) as (
   select 
    label,
    norm_qty, 
    log(t.norm_qty) as log,
    case 
     when log(t.norm_qty) < 0 
     then floor(log(t.norm_qty)) 
     else ceil(log(t.norm_qty)) 
    end ord
   from norm t
  )
  select
   norm_ord.label,
   norm_ord.norm_qty,
   norm_ord.norm_qty / uu.coefficient val,
   uu.unit
  from 
   norm_ord,
   uu where uu.u_ord = 
     (select max(uu.u_ord) 
      from uu 
      where mod(norm_ord.norm_qty , uu.coefficient) = 0);

しかし、トリックを行うようです:

|   LABEL | NORM_QTY | VAL |       UNIT |
-----------------------------------------
| mercury |   1.5e-8 |  15 | microlitre |
|   water |  0.00112 | 112 | centilitre |

unit_conversion同じファミリ内のユニットは、ファミリがcoefficient識別されている限り、の順序で相互に自然に関連しているため、表の親子関係は実際には必要ありません。


2

これは大幅に簡略化できると思います。

1. unit_conversionテーブルを変更する

または、テーブルを変更できない場合はexp10、10進法でシフトする桁数と一致する「指数の基数10」の列を追加するだけです。

CREATE TABLE unit_conversion(
   unit text PRIMARY KEY
  ,exp10 int
);

INSERT INTO unit_conversion VALUES
     ('microlitre', 0)
    ,('millilitre', 3)
    ,('centilitre', 4)
    ,('litre',      6)
    ,('hectolitre', 8)
    ,('kilolitre',  9)
    ,('megalitre',  12)
    ,('decilitre',  5);

2.関数を書き込む

左または右にシフトする位置の数を計算するには:

CREATE OR REPLACE FUNCTION f_shift_comma(n numeric)
  RETURNS int LANGUAGE SQL IMMUTABLE AS
$$
SELECT CASE WHEN ($1 % 1) = 0 THEN                    -- no fractional digits
          CASE WHEN ($1 % 10) = 0 THEN 0              -- no trailing 0, don't shift
          ELSE length(rtrim(trunc($1, 0)::text, '0')) -- trunc() because numeric can be 1.0
                   - length(trunc($1, 0)::text)       -- trailing 0, shift right .. negative
          END
       ELSE                                           -- fractional digits
          length(rtrim(($1 % 1)::text, '0')) - 2      -- shift left .. positive
       END
$$;

3.クエリ

SELECT DISTINCT ON (substance_id)
       s.substance_id, s.label, s.quantity, s.unit
      ,COALESCE(s.quantity * 10^(u1.exp10 - u2.exp10)::numeric
              , s.quantity)::float8 AS norm_quantity
      ,COALESCE(u2.unit, s.unit) AS norm_unit
FROM   substance s 
JOIN   unit_conversion u1 USING (unit)
LEFT   JOIN unit_conversion u2 ON f_shift_comma(s.quantity) <> 0
                              AND @(u2.exp10 - (u1.exp10 - f_shift_comma(s.quantity))) < 2
                              -- since maximum gap between exp10 in unit table = 3
                              -- adapt to ceil(to max_gap / 2) if you have bigger gaps
ORDER  BY s.substance_id
     , @(u2.exp10 - (u1.exp10 - f_shift_comma(s.quantity))) -- closest unit first
     , u2.exp10    -- smaller unit first to avoid point for ties.

説明:

  • JOINサブスタンスとユニットテーブル。
  • f_shift_comma()上からの関数でシフトする位置の理想的な数を計算します。
  • ユニットテーブルにもう一度参加して、最適に近いユニットを見つけます。
  • DISTINCT ON ()およびで最も近い単位を選択しORDER BYます。
  • 適切なユニットが見つからない場合は、以前のユニットにフォールバックしCOALESCE()ます。
  • これはすべてのコーナーケースをカバーし、かなり高速になるはずです

-> SQLfiddleデモ。


1
@DaveJarvis:そして、私はすべてをカバーしていたと思いました...この詳細は、そうでなければ慎重に作成された質問で本当に役立ちます。
Erwin Brandstetter 2013
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.