8文字のみのUUIDの生成


82

UUIDライブラリは32文字のUUIDを生成します。

8文字のみのUUIDを生成したいのですが、可能ですか?


承知しました。しかし、それはおそらくそれほど単純ではなく、短いほど実際に一意である可能性は低くなります。なぜ?

@delnan、組み込み環境で使用しますか?
Allen Zhang

1
結果の文字列をUTF-8に格納できる場合は、1文字あたり4バイトになる可能性があります。その範囲全体を使用できる場合、同じ情報を表すのに必要なUTF-8文字は4文字だけです。
EECOLOR 2018

回答:


72

UUIDは定義ごとに16バイトの数値であるため、これは不可能です。ただし、もちろん、8文字の長さの一意の文字列を生成できます(他の回答を参照)。

また、IDの一部に固定バイトが含まれる場合があるため(たとえば、MAC、DCE、およびMD5 UUIDの場合)、より長いUUIDを生成してサブストリング化することにも注意してください。


タイムスタンプはどう
ですか

60

あなたはRandomStringUtils apache.commonsからクラスを試すことができます:

import org.apache.commons.lang3.RandomStringUtils;

final int SHORT_ID_LENGTH = 8;

// all possible unicode characters
String shortId = RandomStringUtils.random(SHORT_ID_LENGTH);

URLでも人間にもわかりにくい文字がすべて含まれていることに注意してください。

したがって、他の方法も確認してください。

// HEX: 0-9, a-f. For example: 6587fddb, c0f182c1
shortId = RandomStringUtils.random(8, "0123456789abcdef"); 

// a-z, A-Z. For example: eRkgbzeF, MFcWSksx
shortId = RandomStringUtils.randomAlphabetic(8); 

// 0-9. For example: 76091014, 03771122
shortId = RandomStringUtils.randomNumeric(8); 

// a-z, A-Z, 0-9. For example: WRMcpIk7, s57JwCVA
shortId = RandomStringUtils.randomAlphanumeric(8); 

他の人が言ったように、より小さなIDとのID衝突の確率は重要である可能性があります。誕生日の問題があなたのケースにどのように当てはまるかを確認してください。あなたはこの答えで近似を計算する方法の良い説明を見つけることができます。


4
org.apache.commons.lang3.RandomStringUtilsは非推奨であるためorg.apache.commons.text.RandomStringGeneratorcommons.apache.org
proper /

RandomStringGeneratorまったく異なるコードであるため、の新しい回答を追加しました。
BrunoJCM 2017

2
将来の視聴者のための参考までに、ランダム性は一意性を保証するものではありません。ランダムジェネレーターはランダム性を保証します。繰り返し値を持つ有効な乱数のセットを生成できます。
Vishnu PrasadV18年

RandomStringUtils非推奨ではありません。簡単な使用を目的としています。RandomStringUtils非推奨となる情報のソースを提供できますか?私は、最新バージョンのドキュメントを提供することができますRandomStringUtils:それは廃止されていないことを証明するものとしてcommons.apache.org/proper/commons-lang/javadocs/api-3.9/org/...
KRM

すでに使用されているuuidを使用してマップまたはハッシュセットをチェックするだけで、衝突の可能性が非常に高くなります。
アントン

18

まず、javaUUID.randomUUIDまたは.netGUIDによって生成された一意のIDでさえ100%一意ではありません。特にUUID.randomUUIDは、128ビット(セキュア)のランダム値に「のみ」含まれます。したがって、64ビット、32ビット、16ビット(または1ビット)に減らすと、単純に一意性が低下します。

したがって、それは少なくともリスクベースの決定であり、uuidの長さでなければなりません。

2番目:「8文字のみ」とは、通常の印刷可能な8文字の文字列を意味すると思います。

印刷可能な長さが8文字の一意の文字列が必要な場合は、base64エンコーディングを使用できます。これは、1文字あたり6ビットを意味するため、合計で48ビットになります(あまりユニークではない可能性がありますが、アプリケーションには問題ないかもしれません)

したがって、方法は簡単です。6バイトのランダム配列を作成します。

 SecureRandom rand;
 // ...
 byte[] randomBytes = new byte[16];
 rand.nextBytes(randomBytes);

そして、それをBase64文字列に変換します。 org.apache.commons.codec.binary.Base64

ところで:「uuid」をランダムに作成するより良い方法があるかどうかは、アプリケーションによって異なります。(UUIDを1秒に1回だけ作成する場合は、タイムスタンプを追加することをお勧めします)(ちなみに、2つのランダムな値を(xor)組み合わせると、結果は常に少なくとも最もランダムになります両方のランダム)。


7

@Cephalopodが述べたように、それは不可能ですが、UUIDを22文字に短縮することができます

public static String encodeUUIDBase64(UUID uuid) {
        ByteBuffer bb = ByteBuffer.wrap(new byte[16]);
        bb.putLong(uuid.getMostSignificantBits());
        bb.putLong(uuid.getLeastSignificantBits());
        return StringUtils.trimTrailingCharacter(BaseEncoding.base64Url().encode(bb.array()), '=');
}

2

これは、Anton Purinの回答に基づいて、一意のエラーコードを生成するためにここで使用しているのと同様の方法ですorg.apache.commons.text.RandomStringGeneratorが、非推奨ではなく、より適切なものに依存していますorg.apache.commons.lang3.RandomStringUtils

@Singleton
@Component
public class ErrorCodeGenerator implements Supplier<String> {

    private RandomStringGenerator errorCodeGenerator;

    public ErrorCodeGenerator() {
        errorCodeGenerator = new RandomStringGenerator.Builder()
                .withinRange('0', 'z')
                .filteredBy(t -> t >= '0' && t <= '9', t -> t >= 'A' && t <= 'Z', t -> t >= 'a' && t <= 'z')
                .build();
    }

    @Override
    public String get() {
        return errorCodeGenerator.generate(8);
    }

}

衝突に関するすべてのアドバイスは引き続き適用されます。それらに注意してください。


RandomStringUtils非推奨ではありません。簡単な使用を目的としています。RandomStringUtils非推奨となる情報のソースを提供できますか?私は、最新バージョンのドキュメントを提供することができますRandomStringUtils:それは廃止されていないことを証明するものとしてcommons.apache.org/proper/commons-lang/javadocs/api-3.9/org/...
KRM

さて、もう少し掘り下げてみると、この回答を書いている時点で、最新のリリースでは実際にこのクラスが非推奨になっていることがわかります:github.com/apache/commons-lang/commits/master/src / main / java / org /…おそらくいくつかのフィードバック(user.commons.apache.narkive.com/GVBG2Ar0/…)が戻ってきました。commons.langとにかく言語自体に厳密に関連していないcommons.text、目的を持って作成されたものを使用するべきではありません。
BrunoJCM

BrunoJCMの説明ありがとうございます。現時点RandomStringUtilsでは非推奨ではありません。提供された参考資料によると、RandomStringGenerator単純なユースケースよりもはるかに簡単に使用できるため、非推奨にしないのには十分な理由があります。多分あなたはあなたの答えを更新することができますか?RandomStringUtils単純なユースケースの/いつまたはその機能がに移動する場合はcommons.text、回答を再度更新できますが、現在は誤解を招く恐れがあります。
KRM

メモを追加しましたが、Apache Commonsプロジェクトがテキストユーティリティをからcommons.langに移動していることは明らかcommons.textです。すでに別の場所で使用している以外に、後者ではなく前者を使用する理由はありません。ここでの単純さはかなり主観的なものであり、私の答えはまだ非常に単純であり、CommonsLangをインポートする必要があるものに変更することは決してありません。
BrunoJCM

1

これはどう?実際、このコードは最大13文字を返しますが、UUIDよりも短くなります。

import java.nio.ByteBuffer;
import java.util.UUID;

/**
 * Generate short UUID (13 characters)
 * 
 * @return short UUID
 */
public static String shortUUID() {
  UUID uuid = UUID.randomUUID();
  long l = ByteBuffer.wrap(uuid.toString().getBytes()).getLong();
  return Long.toString(l, Character.MAX_RADIX);
}

4
あなたはそれgetLong()がバッファの最初の8バイトだけを読んでいることを知っています。UUIDには少なくとも36バイトが含まれます。私にはこれがうまくいかないので、私は何かが欠けていますか?
Edwin Dalorzo 2014年

2
最初の8バイトは、UUIDの最上位ビットです。この回答によると、重要度の低いビットはよりランダムです。だからLong.toString(uuid.getLessSignificantBits(), Character.MAX_RADIX)良いです。
douO 2014

0

実際、タイムスタンプベースのより短い一意の識別子が必要なので、以下のプログラムを試してみました。

nanosecond + ( endians.length * endians.length )組み合わせで推測できます。

public class TimStampShorterUUID {

    private static final Character [] endians = 
           {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 
            'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 
            'u', 'v', 'w', 'x', 'y', 'z', 
            'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 
            'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 
            'U', 'V', 'W', 'X', 'Y', 'Z',
            '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'
            };

   private static ThreadLocal<Character> threadLocal =  new ThreadLocal<Character>();

   private static AtomicLong iterator = new AtomicLong(-1);


    public static String generateShorterTxnId() {
        // Keep this as secure random when we want more secure, in distributed systems
        int firstLetter = ThreadLocalRandom.current().nextInt(0, (endians.length));

        //Sometimes your randomness and timestamp will be same value,
        //when multiple threads are trying at the same nano second
        //time hence to differentiate it, utilize the threads requesting
        //for this value, the possible unique thread numbers == endians.length
        Character secondLetter = threadLocal.get();
        if (secondLetter == null) {
            synchronized (threadLocal) {
                if (secondLetter == null) {
                    threadLocal.set(endians[(int) (iterator.incrementAndGet() % endians.length)]);
                }
            }
            secondLetter = threadLocal.get();
        }
        return "" + endians[firstLetter] + secondLetter + System.nanoTime();
    }


    public static void main(String[] args) {

        Map<String, String> uniqueKeysTestMap = new ConcurrentHashMap<>();

        Thread t1 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }       
        };

        Thread t2 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }       
        };

        Thread t3 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }       
        };

        Thread t4 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }       
        };

        Thread t5 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }
        };

        Thread t6 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }   
        };

        Thread t7 = new Thread() {  
            @Override
            public void run() {
                while(true) {
                    String time = generateShorterTxnId();
                    String result = uniqueKeysTestMap.put(time, "");
                    if(result != null) {
                        System.out.println("failed! - " + time);
                    }
                }
            }
        };

        t1.start();
        t2.start();
        t3.start();
        t4.start();
        t5.start();
        t6.start();
        t7.start();
    }
}

更新:このコードは単一のJVMで機能しますが、分散JVMについて考える必要があるため、DBを使用するソリューションとDBを使用しないソリューションの2つのソリューションを考えています。

DB付き

会社名(短縮名3文字)---- Random_Number ----キー固有のredisCOUNTER
(3文字)-------------------------- ----------------------(2文字)----------------(11文字)

DBなし

IPADDRESS ---- THREAD_NUMBER ---- INCR_NUMBER ----エポックミリ秒
(5文字)-----------------(2文字)--------- --------------(2文字)-----------------(6文字)

コーディングが完了すると更新されます。



-11

私はそれが可能だとは思いませんが、あなたには良い回避策があります。

  1. substring()を使用してUUIDの終わりを切り取ります
  2. コードを使用するnew Random(System.currentTimeMillis()).nextInt(99999999); と、最大8文字のランダムIDが生成されます。
  3. 英数字IDを生成します:

    char[] chars = "abcdefghijklmnopqrstuvwxyzABSDEFGHIJKLMNOPQRSTUVWXYZ1234567890".toCharArray();
    Random r = new Random(System.currentTimeMillis());
    char[] id = new char[8];
    for (int i = 0;  i < 8;  i++) {
        id[i] = chars[r.nextInt(chars.length)];
    }
    return new String(id);
    

14
残念ながら、これらのアプローチはすべて、必要な時間よりも早く繰り返し(つまり、一意でないID)を提供する可能性があります。
スティーブンC

1
空のコンストラクターを使用するよりも、現在の日付でシードする方がランダムではありませんか?
Patrick Favre 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.