データベース管理者 random

2

byteaテストデータを入力するために、任意の長さ（<1Gb）のランダムフィールドを生成できるようにしたいと思います。これを行う最善の方法は何ですか？

18 postgresql testing random bytea

3

階層を含むテストデータを作成する必要があります。私はそれを簡単にし、いくつかのことをすることができましたが、それCROSS JOINは私に完全に均一な/変化のない構造を与えるでしょう。それは鈍いように見えるだけでなく、テストデータの変動がないために、他の方法では見つからない問題を隠してしまうことがあります。だから、私はこれらのルールに従う不均一な階層を生成したいと思っています：深さ3レベルレベル1はランダムに5〜20ノードですレベル2は1〜10ノードで、レベル1の各ノードごとにランダムですレベル3は1〜5ノードで、レベル2の各ノードごとにランダムですすべてのブランチは3レベルの深さになります。この時点で深さの均一性は問題ありません。任意のレベルで子ノードの名前が重複する可能性があります（つまり、子ノードの名前は、同じレベルのすべてのノードで一意である必要はありません）。ここで「ランダム」という用語は、一意にランダムではなく、疑似ランダムであると定義されています。「ランダム」という用語は「複製を生成しない特定のセットのランダムな順序」を意味するためによく使用されるため、これについて言及する必要があります。ランダム=ランダムを受け入れ、レベル1の各ノードあたりの子の数が4、7、および8のみである場合、レベル1の20のノードでさえ、それらのノードごとに1-10の子の潜在的な広がりがある場合、それは問題ありません、なぜならそれがランダムであるからです。これは入れ子にすると非常に簡単にできますが WHILEループを使用してますが、設定ベースのアプローチを見つけることが優先ます。一般的に、テストデータの生成にはプロダクションコードに必要な効率性の要件はありませんが、セットベースのアプローチの撮影はより教育的であり、問題に対するセットベースのアプローチを見つけるのに役立つでしょう。したがって、WHILEループは除外されませんが、セットベースのアプローチが不可能な場合にのみ使用できます。 Set-based =理想的には、CTE、APPLYなどに関係なく、単一のクエリです。したがって、既存またはインラインの数値テーブルを使用するのが適切です。WHILE / CURSOR /手続き型アプローチを使用しても機能しません。操作がすべてセットベースでループがない限り、データの一部を一時テーブルまたはテーブル変数にステージングすると思います。ただし、そうは言っても、複数クエリアプローチの方が実際に優れていることが示されない限り、単一クエリアプローチの方が複数のクエリよりも好まれます。「より良い」を構成するものは通常主観的であることに注意してください;-)。また、前の文での「通常」の使用も主観的であることに留意してください。 SQL Serverのすべてのバージョンとエディション（2005年以降、私は推測します）で対応します。純粋なT-SQLのみ：その愚かなSQLCLRのものはありません!! 少なくともデータの生成に関しては。ディレクトリとファイルの作成は、SQLCLRを使用して行われます。しかし、ここでは、作成するものの価値を生成することに焦点を当てています。 T-SQL Multi-statement TVFは、外部ではセットの手続き型アプローチをマスクしているにもかかわらず、セットベースではなく手続き型と見なされます。それが絶対に適切な場合があります。これは当時のものではありません。それらと同じ線に沿って、T-SQLスカラー関数も手続き型であるという理由だけでなく、クエリオプティマイザーが値をキャッシュして、出力が期待どおりにならないように繰り返すこともあります。 T-SQLインラインTVF（別名iTVF）は、セットベースであるため、okey-dokey [ CROSS | OUTER ] APPLYであり、上記のok として説明したを使用するのと実質的に同じです。クエリを繰り返し実行すると、前回の実行とほとんど異なる結果が生成されます。明確化の更新1：最終結果セットは、レベル1で始まるフルパスを持つ、レベル3の個別のノードごとに1つの行を持つように表現する必要があります。これは、単一のLevel3ノードのみを含む単一のLevel2ノードしかない場合を除いて、Level1とLevel2の値が必ず1つ以上の行にわたって繰り返されることを意味します。明確化の更新2：番号だけでなく、名前またはラベルを持つ各ノードに非常に強い優先順位があります。これにより、結果として得られるテストデータがより有意義で現実的になります。この追加情報が重要かどうかはわかりませんが、何らかのコンテキストが役立つ場合に備えて、テストデータはこの質問に対する私の回答に関連しています。 XMLファイルをSQL Server 2012にインポートするこの時点では関係ありませんが、この階層を生成する最終目標は、ディレクトリ構造を作成して、再帰的なファイルシステムメソッドをテストすることです。レベル1と2はディレクトリになり、レベル3はファイル名になります。私は周りを検索しました（ここでもGoogle経由でも）で、ランダムな階層を生成するための参照が1つだけ見つかりました。 Linux：ランダムなディレクトリ/ファイル階層を作成する（StackOverflowでの）その質問は、テスト用のディレクトリ構造を作成しようとするため、実際には望ましい結果の点で非常に近いです。しかし、その質問（および回答）はLinux / Unixシェルスクリプトに焦点を当てており、私たちが住んでいるセットベースの世界ではありません。これで、ランダムデータを生成する方法がわかりました。また、バリエーションを表示できるように、ファイルのコンテンツを作成するために既にそうしています。ここで注意が必要なのは、特定のフィールドではなく、各セット内の要素の数がランダムであることです。また、各ノード内の要素の数は、同じレベルの他のノードからランダムである必要があります。階層の例 Level 1 Level 3 |---- …

16 sql-server t-sql hierarchy random

3

セットからランダムな値を設定する

ランダムな値をデータベースに入れる必要がありますが、完全にランダム化されたテキスト（7hfg43d3など）にしたくありません。代わりに、自分で指定した値の1つをランダムに選択します。

11 postgresql random

2

デフォルト値のランダム文字列でDBに列を作成する方法

デフォルト値のランダム文字列を持つDBテーブル（PostgreSQL）に列を作成できますか？それが不可能な場合は、その旨をお知らせください。

10 postgresql default-value random

4

MySQLで複雑なGROUP BYを実行するにはどうすればよいですか？

他のテーブルへのいくつかのキーを含むテーブルがあります（各キーは複数の列で構成されています）。等しいキーを持つ行をグループ化したいのですが、それらすべてをグループ化したくありません。それは単純なGROUP BYキーではなく、たとえば10のグループを作成できるようにしたいのです。したがって、特定のキーが50回表示された場合、このグループ化（5グループの10）を実行すると5つの結果が得られます。また、このグループ化をキー内でランダムに発生させます。私はこれを行う直接的な方法を知りませんでした、そして私が思いついたラウンドアバウト方式は私が思っているように機能していません。私が思いついたラウンドアバウト交差点の解決策は、値がそのキーiのith出現を（ただしランダムな順序で）表すような整数である各キーの新しい列を作成することでした。次に、整数の除算を行って、キー内のすべてのn（たとえば10）行が同じ値になるようにし、GROUP BYその値に対してa を行うことができます。今説明したことを達成するためのより直接的な方法はありますか？これはかなり厄介で、新しいインデックス列を作成するときに問題が発生しました（この質問で説明したように）。編集：まず、これはMySQL用であることに注意してください。目標が明確でない場合に備えて、例を追加します。MySQLのドキュメントはほとんどそこに到達する方法を示しています： CREATE TABLE animals ( grp ENUM('fish','mammal','bird') NOT NULL, id MEDIUMINT NOT NULL AUTO_INCREMENT, name CHAR(30) NOT NULL, PRIMARY KEY (grp,id) ) ENGINE=MyISAM; INSERT INTO animals (grp,name) VALUES ('mammal','dog'),('mammal','cat'), ('bird','penguin'),('fish','lax'),('mammal','whale'), ('bird','ostrich'); SELECT * FROM animals ORDER BY grp,id; これは、私が望むものではありませんが、近くなるテーブルを作成します： +--------+----+---------+ | grp | id …

8 mysql order-by random

タグ付けされた質問 「random」

タグ付けされた質問「random」