回答:
fedorquiの正解に加えて、文字列の長さとバイトの長さの違いを示したいと思います。
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
レンダリングされます:
Généralités is 11 char len, but 14 bytes len.
格納されている文字を確認することもできます。
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
答えます:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
注意:Isabell Cowanのコメントによると、にの設定を追加$LC_ALL
しました$LANG
。
引数は通常の変数と同じように機能します
strLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
として機能します
strLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
printf
修正ツール:もし、あんたが:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
本当にきれいではありません...このために、小さな関数があります:
strU8DiffLen () {
local bytlen oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
LANG=$oLang LC_ALL=$oLcAll
return $(( bytlen - ${#1} ))
}
そして今:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but uses 14 bytes
- 'Language' is 8 chars length, but uses 8 bytes
- 'Théorème' is 8 chars length, but uses 10 bytes
- 'Février' is 7 chars length, but uses 8 bytes
- 'Left: ←' is 7 chars length, but uses 9 bytes
- 'Yin Yang ☯' is 10 chars length, but uses 12 bytes
しかし、ダブルスペース文字、ゼロスペース文字、逆置換など、それほど単純ではない可能性がある奇妙なUTF-8動作が残っていました...
その他の制限については、diffU8test.shまたはdiffU8test.sh.txtをご覧ください。
変数に格納されている文字列の長さを取得するには、次のようにします。
myvar="some string"
size=${#myvar}
適切に保存されたことを確認するには、次のecho
ようにします。
$ echo "$size"
11
$rulename
して開始を$RULE_PREFIX
接頭辞: [ "${rulename:0:${#RULE_PREFIX}}" == "$RULE_PREFIX" ]
#myvar
and の表現について少し説明してもらえます{#myvar}
か?
${#parameter}
:パラメータの拡張値の文字の長さが置換されます。
以下を使用できます。
MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
wc -c
またはwc --bytes
バイトカウントの場合= Unicode文字は2、3、またはそれ以上のバイトでカウントされます。wc -m
またはwc --chars
文字数の場合=より多くのバイトを使用するまで、Unicode文字は1つとしてカウントされます。mylen=$(printf "%s" "$HOME/.ssh" | wc -c)
が、受け入れられたソリューションは失敗し、myvar=$HOME/.ssh
最初に行う必要があります。
私は最も単純なケースが欲しかった、最後にこれは結果です:
echo -n 'Tell me the length of this sentence.' | wc -m;
36
echo '' | wc -m
=> 1
。使用する必要があります-n
: echo -n '' | wc -m
=> 0
...その場合、それは良い解決策です:)
-n do not output the trailing newline
コマンドラインまたは関数の引数でこれを使用する場合は、のsize=${#1}
代わりに使用してくださいsize=${#$1}
。2つ目はより本能的かもしれませんが、構文が正しくありません。
size=${#1}
確かに有効です。
#
を置き換えていません$
- $
中括弧の外側はまだ拡張演算子です。#
いつものように、長さ演算子です。
変数の長さを計算する方法がいくつかあります:
echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'
別の変数に結果を設定するには、次のように、上記のコマンドを別の変数に逆引用符で割り当てます。
otherVar=`echo -n $VAR | wc -m`
echo $otherVar
http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html