タグ付けされた質問 「indexing」

データ構造のインデックス作成は、データ検索の速度を向上させる一般的な手法です。


8
データベースのインデックス付けはどのように機能しますか?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 2年前休業。 データセットのサイズが大きくなると、インデックス付けが非常に重要になるので、データベースに依存しないレベルでインデックス付けがどのように機能するかを誰かが説明できますか? フィールドにインデックスを付けるクエリの詳細については、データベースの列にインデックスを付ける方法をご覧ください。


11
クラスタ化インデックスと非クラスタ化インデックスは実際にはどういう意味ですか?
私はDBにあまり触れておらず、DBをアプリケーションプログラマとしてのみ使用しています。私が知りたいClusteredとNon clustered indexes。私はグーグルで私が見つけたものは: クラスター化インデックスは、テーブル内のレコードが物理的に格納される方法を並べ替える特別な種類のインデックスです。したがって、テーブルにはクラスタ化インデックスを1つだけ含めることができます。クラスタ化インデックスのリーフノードには、データページが含まれています。非クラスタ化インデックスは、インデックスの論理的な順序がディスク上の行の物理的な格納順序と一致しない特殊なタイプのインデックスです。非クラスター化インデックスのリーフノードは、データページで構成されていません。代わりに、リーフノードにはインデックス行が含まれます。 私がSOで見つけたのは、クラスター化インデックスと非クラスター化インデックスの違いは何ですか?。 誰かが簡単な英語でこれを説明できますか?

5
複数のインデックスと複数列のインデックス
SQL Server 2005でテーブルにインデックスを追加したばかりで、考えていました。1つのインデックスを作成することと、インデックスを作成する列ごとに1つのインデックスを持つよりも複数の列を定義することの違いは何ですか。 一方を他方よりも使用する必要がある特定の理由はありますか? 例えば Create NonClustered Index IX_IndexName On TableName (Column1 Asc, Column2 Asc, Column3 Asc) 対 Create NonClustered Index IX_IndexName1 On TableName (Column1 Asc) Create NonClustered Index IX_IndexName2 On TableName (Column2 Asc) Create NonClustered Index IX_IndexName3 On TableName (Column3 Asc)

3
iloc、ix、locの違いは何ですか?
誰かがこれらの3つのスライス方法がどのように異なるか説明できますか? 私はドキュメントを見て、これらの 答えを見ましたが、それでも私は3つがどのように違うのか説明することができません。私にとっては、スライスのレベルが低いため、それらは大部分が交換可能に見えます。 たとえば、の最初の5行を取得するとしDataFrameます。これら3つすべてがどのように機能するのですか? df.loc[:5] df.ix[:5] df.iloc[:5] 誰かが使用の区別がより明確な3つのケースを提示できますか?





8
インデックスを作成するときにINCLUDE句を使用する理由
70-433試験の勉強中に、次の2つの方法のいずれかでカバーインデックスを作成できることに気付きました。 CREATE INDEX idx1 ON MyTable (Col1, Col2, Col3) -または- CREATE INDEX idx1 ON MyTable (Col1) INCLUDE (Col2, Col3) INCLUDE句は私にとって新しいものです。なぜそれを使用し、INCLUDE句の有無にかかわらずカバリングインデックスを作成するかを決定する際にどのようなガイドラインを提案しますか?

6
MySQLテーブルにインデックスを追加するにはどうすればよいですか?
約150,000行のデータを含む非常に大きなMySQLテーブルがあります。現在、実行してみると SELECT * FROM table WHERE id = '1'; IDフィールドがプライマリインデックスであるため、コードは正常に実行されます。しかし、プロジェクトの最近の進展のために、別のフィールドでデータベースを検索する必要があります。例えば: SELECT * FROM table WHERE product_id = '1'; このフィールドは以前に索引付けされていませんでした。ただし、1つ追加したので、mysqlはフィールドにインデックスを付けますが、上記のクエリを実行しようとすると、実行速度が非常に遅くなります。EXPLAINクエリにより、product_idフィールドに既にインデックスを追加している場合、インデックスがないことがわかります。その結果、クエリは20分から30分で1つの行を返します。 私の完全なEXPLAIN結果は次のとおりです。 | id | select_type | table | type | possible_keys| key | key_len | ref | rows | Extra | +----+-------------+-------+------+--------------+------+---------+------+-------+------------------+ | 1 | SIMPLE | table | ALL | …

6
保存されたcsvにPython / Pandasがインデックスを作成しないようにするにはどうすればよいですか?
ファイルを編集した後、csvをフォルダーに保存しようとしています。 pd.to_csv('C:/Path of file.csv')csvファイルを使用するたびに、インデックスの個別の列があります。インデックスをcsvに出力しないようにしたい。 私は試した: pd.read_csv('C:/Path to file to edit.csv', index_col = False) そしてファイルを保存するには... pd.to_csv('C:/Path to save edited file.csv', index_col = False) しかし、私はまだ不要なインデックス列を取得しました。ファイルを保存するときにこれを回避するにはどうすればよいですか?
407 python  csv  indexing  pandas 

8
MySQLインデックスはどのように機能しますか?
MySQLのインデックスがどのように機能するかに本当に興味があります。具体的には、テーブル全体をスキャンせずに、要求されたデータをどのように返すことができますか? トピック外ですが、詳しく説明してくれる人がいたら、とてもありがたいです。
402 mysql  indexing 

6
整数インデックスによるパンダシリーズ/データフレームの行の選択
なぜか知りたい df[2]、しばらくはサポートされていないdf.ix[2]とdf[2:3]仕事の両方を。 In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 私はdf[2]同じように働くと期待しますdf[2:3]、Pythonのインデックス付け規則に準拠するのとています。単一の整数による行のインデックス付けをサポートしない設計上の理由はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.