DebianでPostgres 9.4.4を実行していますが、次のようORDER BY
な動作になります。
veure_test=# show LC_COLLATE;
lc_collate
-------------
en_US.UTF-8
(1 row)
veure_test=# SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') ORDER BY 1;
regexp_split_to_table
-----------------------
a
A
b
c
Capacitor
CD
d
D
(8 rows)
そしてuname -a
:
Linux ---- 3.2.0-4-amd64 #1 SMP Debian 3.2.65-1 x86_64 GNU/Linux
しかし、Postgres 9.3.4を搭載したiMacでは、次のものが得られます。
veure_test=# show LC_COLLATE;
lc_collate
-------------
en_US.UTF-8
(1 row)
veure_test=# SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') ORDER BY 1;
regexp_split_to_table
-----------------------
A
CD
Capacitor
D
a
b
c
d
(8 rows)
そしてuname -a
:
Darwin ---- 14.4.0 Darwin Kernel Version 14.4.0: Thu May 28 11:35:04 PDT 2015; root:xnu-2782.30.5~1/RELEASE_X86_64 x86_64
Debianバージョンが大文字と小文字を区別しないように見え、OS Xバージョンがそうではない理由に私は不思議に思っています。何が欠けていますか、または他にどのような情報を提供する必要がありますか?
更新:私のMacでは、pg_collation
表にen_US.UTF-8
照合があることが示されていますが、Debianではen_US.utf8
照合があります。したがって、私のMacでは:
veure_test=# with foo as (
SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') as bar
)
SELECT bar FROM foo
ORDER BY bar collate "en_US.UTF-8";
bar
-----------
A
CD
Capacitor
D
a
b
c
d
(8 rows)
Debianの場合:
veure_test=# with foo as (
SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') as bar
)
SELECT bar FROM foo
ORDER BY bar collate "en_US.utf8";
bar
-----------
a
A
b
c
Capacitor
CD
d
D
(8 rows)
それでen_US.UTF-8
、en_US.utf8
異なるソート順がありますか?
select * from pg_collation
は、Debianのボックスにはがen_US.utf8
、OS Xにはがあることがわかりますen_US.UTF-8
。それらを使用してそれぞれのボックスで明示的に照合を強制すると、異なる並べ替え順序が表示されます:
'D d a A c b CD Capacitor'
がtext
Macのフィールドとしてキャストされていない可能性はありますか?IE、SELECT regexp_split_to_table('D d a A c b CD Capacitor'::text, ' ') ORDER BY 1;
何が起こるか試してみてください