特定の条件で2つから1つのデータテーブルを作成する


13

まず、ODBCからすべてのデータを取得する必要があります(これは既に機能しています)。

次に、どのようにそれを行うことができるのかまだわからない、最も複雑な部分があります。ODBCには2つのデータテーブルがあります。それらを現在のコードとマージし、特定のパラメータでフィルタリングしています。

データベースの表1:

NRO   NAME   NAMEA   NAMEB   ADDRESS   POSTA   POSTN   POSTADR   COMPANYN   COUNTRY   ID  ACTIVE
123   Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
133   Opel   Meriva  FTG     J5        K4      O3      P4        O2         JO        3   1
153   MB     E200    C25     JN        KI      OP      PY        OR         JD        5   1
183   BMW    E64     SE0     JR        KE      OT      PG        OL         J8        9   1
103   Audi   S6      700     JP        KU      OU      PN        OH         J6        11  1 

データベースの表2:

NRO   NAME   NAMEA   NAMEB   ADDRESS   POSTA   POSTN   POSTADR   COMPANYN   COUNTRY   ID  ACTIVE
423   Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
463   BMW    E64     SE0     JR        KE      OT      PG        OL         J8        9   1

マージされたdataTableは次のようになります。

NRO   NAME   NAMEA   NAMEB   ADDRESS   POSTA   POSTN   POSTADR   COMPANYN   COUNTRY   ID  ACTIVE
423   Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
463   BMW    E64     SE0     JR        KE      OT      PG        OL         J8        9   1
123   Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
133   Opel   Meriva  FTG     J5        K4      O3      P4        O2         JO        3   1
153   MB     E200    C25     JN        KI      OP      PY        OR         JD        5   1
183   BMW    E64     SE0     JR        KE      OT      PG        OL         J8        9   1
103   Audi   S6      700     JP        KU      OU      PN        OH         J6        11  1 

ただし、マージされた出力dataTableは次のようになります(さらに操作する可能性があります)。

NRO  NRO1   NAME   NAMEA   NAMEB   ADDRESS   POSTA   POSTN   POSTADR   COMPANYN   COUNTRY   ID  ACTIVE
123  423    Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
133         Opel   Meriva  FTG     J5        K4      O3      P4        O2         JO        3   1
153         MB     E200    C25     JN        KI      OP      PY        OR         JD        5   1
183  463    BMW    E64     SE0     JR        KE      OT      PG        OL         J8        9   1
103         Audi   S6      700     JP        KU      OU      PN        OH         J6        11  1 

で重複を検索しNAMEます。そのうちの1つだけを残し、表1 NROから表2までの番号を割り当てNRO1ます。表1の数字はNRO、表2の数字はにあるはずNRO1です。

ODBCに接続した後、1つのテーブルに表1のデータを入力します

        DataTable dataTable = new DataTable("COMPANY");

        using (OdbcConnection dbConnectionSE = new OdbcConnection(connectionStringSE))
        {
            dbConnectionSE.Open();
            OdbcDataAdapter dadapterSE = new OdbcDataAdapter();
            dadapterSE.SelectCommand = new OdbcCommand(queryStringSE, dbConnectionSE);

            dadapterSE.Fill(dataTable);

        }

次に、別の表2からデータを取得し、次のようにマージします。

         using (OdbcConnection dbConnectionFI = new OdbcConnection(connectionStringFI))
         {
              dbConnectionFI.Open();
              OdbcDataAdapter dadapterFI = new OdbcDataAdapter();
              dadapterFI.SelectCommand = new OdbcCommand(queryStringFI, dbConnectionFI);

              var newTable = new DataTable("COMPANY");
              dadapterFI.Fill(newTable);

              dataTable.Merge(newTable);
          }

その後、フィルタリングを実行しています(には4と1で始まる行のみが必要ですがNRO、他の開始番号の行もあります)。

DataTable results = dataTable.Select("ACTIVE = '1' AND (NRO Like '1%' OR NRO Like '4%')").CopyToDataTable();

次に、さらに1つの列を追加しますNRO1(これは、ゼロも追加します(0)列では必要ありませんNRO1)。

        results.Columns.Add("NRO1", typeof(int)).SetOrdinal(1);

        foreach (DataRow row in results.Rows)
        {
            //need to set value to NewColumn column
            row["NRO1"] = 0;   // or set it to some other value
        }

このコードで重複をキャッチできます

var duplicates = results.AsEnumerable().GroupBy(r => r[2]).Where(gr => gr.Count() > 1);

しかし、残りを実行する方法は?これは、新しいテーブルを作成するループで実行する必要がありますか?重複を結合および削除するにはどうすればよいdataTableですか?


1.dataTable一部の名前に3つ以上の重複を含めることができますか?たとえば、BMWに3つの複製が存在することは可能ですか?2.保持する重複レコードと削除する重複レコードをどのように定義できますか?たとえば、最小限のレコードを保持しNRO、他のレコードを削除できます。
Iliar Turdushev

@IliarTurdushev 1.で、データテーブルに2つ以上の「複製」を含めることはできませんNAME。3つ以上の場合-エラー(エラーハンドラー)。2.例でエラーが発生しました。今すぐ修正しました。これについて言及していただきありがとうございます、それは重要です。
ハットマン

queryStringFIおよび/またはqueryStringSEの値を共有できますか?さらに、どのDBを使用していますか?
ATTA

@ATTA実際のデータベースへのアクセスは提供できません。DBタイプですか?問題になっているように
-ODBC

実際、データを取得するクエリを確認したいのですが、Answerを書いたいくつかの仮定に基づいています。確認してフィードバックをお寄せください。ありがとう
ATTA

回答:


3

merge()呼び出しを、マージとフィルタリングを同時に行うカスタムメソッドに置き換えることができます。以下の例を参照してください。これは、最初にマージ(結果テーブルに重複行を導入)してからフィルタリング(つまり、重複行を削除)するよりも良い方法だと思います。

ここでは、パラメーターはすべて同じ形式であると想定しています。tTempテーブルは、テーブルの内容のための一時的なストレージとして使用されているt2が、追加の列で。これにより、結果テーブルの行をインポートできます。

よりエレガントな解決策があるかもしれませんが、これは意図したとおりに機能するはずです。の許容値に関する追加要件を省略していることに注意してくださいNRO。これは簡単に追加できます。

static void merge_it(DataTable t1, DataTable t2, DataTable tResult, DataTable tTemp)
    {
        tResult.Merge(t1);
        tResult.Columns.Add("NRO1", typeof(int));

        tTemp.Merge(t2);
        tTemp.Columns.Add("NRO1", typeof(int));

        foreach (DataRow row in tTemp.Rows)
        {
            string name1 = row.Field<string>("NAME");
            string name2 = row.Field<string>("NAMEA");
            DataRow[] matches = tResult.Select($"NAME = '{name1}' AND NAMEA = '{name2}'");
            if (matches.Length > 0)
            {
                matches[0].SetField<int>("NRO1", row.Field<int>("NRO"));
            }
            else
            {
                tResult.ImportRow(row);
            }
        }

        foreach (DataRow row in tResult.Rows)
        {
            if (row["NRO1"] == DBNull.Value)
            {
                row["NRO1"] = 0;
            }
        }
    }

これありがとう!私は受け付けておりますように私は何か間違ったことをしたと思い'DataTable' does not contain a definition for 'Merge_it' and no accessible extension method 'Merge_it' accepting a first argument of type 'DataTable' could be found (are you missing a using directive or an assembly reference?)交換した後dataTable.Merge(newTable);dataTable.Merge_it(newTable);
hatman

コードを新しいクラスに配置できます。ちょうどclass Merger {...}私のコードを囲んで呼び出しますMerger.merge_it(...)。ただし、入力パラメータを準備する必要があります。
lzydrmr

...そしてusingもちろん、欠落しているディレクティブを追加する必要があります。これは単なるスニペットです(動作するプログラムから)。
lzydrmr

tResult.Selectに対するforeachのパフォーマンスについてはわかりません。これは、大きなデータテーブルでは非常に遅くなる可能性があります(tResult.SelectがO(n)であると仮定すると、foreachを使用するとO(n ^ 2)実行時間)
CitrusO2

2

これを試して:

  1. Table1とTable2の両方のクエリにNRO1フィールドを含める
  2. Table1にNRO1のデフォルト値0を設定(queryStringSEを変更)

    例:SELECT NRO、0 AS NRO1、NAME、NAMEA、NAMEB、... FROM TABLE1

  3. Table2のNROのデフォルト値を0に設定(queryStringFIを変更)

    例:SELECT 0 AS NRO、NRO AS NRO1、NAME、NAMEA、NAMEB、...... TABLE2から

Table1は次のようになります。

NRO  NRO1   NAME   NAMEA   NAMEB   ADDRESS   POSTA   POSTN   POSTADR   COMPANYN   COUNTRY   ID  ACTIVE
123   0     Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
133   0     Opel   Meriva  FTG     J5        K4      O3      P4        O2         JO        3   1

Table2は次のようになります。

NRO  NRO1   NAME   NAMEA   NAMEB   ADDRESS   POSTA   POSTN   POSTADR   COMPANYN   COUNTRY   ID  ACTIVE
0    423    Fiat   Punto   500     J5        K4      O3      P4        O2         JT        1   1
0    463    BMW    E64     SE0     JR        KE      OT      PG        OL         J8        9   1
  1. すでに行っているようにテーブルをマージする

次のコード行を追加します。

var carGroups = dataTable.AsEnumerable().GroupBy(row => new 
{
   Name = row.Field<string>("Name"),
   NameA = row.Field<string>("NAMEA"),
   NameB = row.Field<string>("NAMEB")
   //Other fields.....
});

DataTable result = dataTable.Clone();

foreach(var grp in carGroups)            
    result.Rows.Add(grp.Sum(r1 => r1.Field<int>("NRO")), grp.Sum(r2 => r2.Field<int>("NRO1")), grp.Key.Name, grp.Key.NameA, grp.Key.NameB);              
  1. DataTableの「結果」で目的の値を確認します

0

同じタイプのエンティティを示す場合、両方のテーブルで同じ列名を保持できます。このコードを参照してください

 private static void DemonstrateMergeTable()
{
    DataTable table1 = new DataTable("Items");

    // Add columns
    DataColumn idColumn = new DataColumn("id", typeof(System.Int32));
    DataColumn itemColumn = new DataColumn("item", typeof(System.Int32));
    table1.Columns.Add(idColumn);
    table1.Columns.Add(itemColumn);

    // Set the primary key column.
    table1.PrimaryKey = new DataColumn[] { idColumn };

    // Add RowChanged event handler for the table.
    table1.RowChanged += new 
        System.Data.DataRowChangeEventHandler(Row_Changed);

    // Add ten rows.
    DataRow row;
    for (int i = 0; i <= 9; i++)
    {
        row = table1.NewRow();
        row["id"] = i;
        row["item"] = i;
        table1.Rows.Add(row);
    }

    // Accept changes.
    table1.AcceptChanges();
    PrintValues(table1, "Original values");

    // Create a second DataTable identical to the first.
    DataTable table2 = table1.Clone();

    // Add column to the second column, so that the 
    // schemas no longer match.
    table2.Columns.Add("newColumn", typeof(System.String));

    // Add three rows. Note that the id column can't be the 
    // same as existing rows in the original table.
    row = table2.NewRow();
    row["id"] = 14;
    row["item"] = 774;
    row["newColumn"] = "new column 1";
    table2.Rows.Add(row);

    row = table2.NewRow();
    row["id"] = 12;
    row["item"] = 555;
    row["newColumn"] = "new column 2";
    table2.Rows.Add(row);

    row = table2.NewRow();
    row["id"] = 13;
    row["item"] = 665;
    row["newColumn"] = "new column 3";
    table2.Rows.Add(row);

    // Merge table2 into the table1.
    Console.WriteLine("Merging");
    table1.Merge(table2, false, MissingSchemaAction.Add);
    PrintValues(table1, "Merged With table1, schema added");
}

private static void Row_Changed(object sender, 
    DataRowChangeEventArgs e)
{
    Console.WriteLine("Row changed {0}\t{1}", e.Action, 
        e.Row.ItemArray[0]);
}

private static void PrintValues(DataTable table, string label)
{
    // Display the values in the supplied DataTable:
    Console.WriteLine(label);
    foreach (DataRow row in table.Rows)
    {
        foreach (DataColumn col in table.Columns)
        {
            Console.Write("\t " + row[col].ToString());
        }
        Console.WriteLine();
    }
}
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.