別のフィールドの値を使用してMongoDBフィールドを更新する


372

MongoDBでは、別のフィールドの値を使用してフィールドの値を更新できますか?同等のSQLは次のようになります。

UPDATE Person SET Name = FirstName + ' ' + LastName

そして、MongoDB疑似コードは次のようになります。

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );

回答:


259

これを行うための最良の方法は、バージョン4.2以降であり、更新ドキュメントおよびupdateOneupdateManyまたはupdateコレクションメソッドで集約パイプラインを使用できます。後者は、すべてではないにしてもほとんどの言語ドライバーで廃止されていることに注意してください。

MongoDB 4.2以降

バージョン4.2では、$setのエイリアスであるパイプラインステージ演算子も導入されました $addFields$setここでは、達成しようとしていることをマッピングするために使用します。

db.collection.<update method>(
    {},
    [
        {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
    ]
)

MongoDB 3.4以降

3.4以降$addFieldsでは、$out集計パイプライン演算子を使用できます。

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": "collection" }
    ]
)

これによってコレクションが更新されるのではなく、既存のコレクションが置き換えられるか、新しいコレクションが作成されることに注意してください。また、「型キャスト」を必要とする更新操作の場合、クライアント側の処理が必要になります。操作によっては、find()メソッドの代わりにメソッドを使用する必要がある場合があります.aggreate()

MongoDB 3.2および3.0

これを行う方法は$project、ドキュメントにingし、$concat文字列集計演算子を使用して連結された文字列を返すことです。次に、カーソルを反復処理し、$set更新演算子を使用して、一括操作を使用して新しいフィールドをドキュメントに追加し、効率を最大化します。

集計クエリ:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2以降

これから、bulkWriteメソッドを使用する必要があります。

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6および3.0

このバージョンから、非推奨になったBulkAPIとその関連メソッドを使用する必要があります

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})

「MongoDB 3.2以降」のコードに問題があると思います。forEachは非同期であるため、通常、最後のbulkWriteには何も書き込まれません。
Viktor Hedefalk、

3
4.2+機能しません。MongoError:「name。$ concat」のドル($)接頭辞付きフィールド「$ concat」は、ストレージには無効です。
Josh Woodcock、

@JoshWoodcock、実行しているクエリにタイプミスがあったと思います。再確認することをお勧めします。
スタイベーン

@JoshWoodcockそれは美しく動作します。MongoDB Webシェル
styvane

2
@JoshWoodcockで説明されている同じ問題が発生した場合は、4.2以降の回答が集約パイプラインを説明していることに注意してください。2 番目のパラメータの角括弧をお見逃しなく!
フィリップ

240

反復する必要があります。あなたの特定のケースについて:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

4
別のユーザーがfind()とsave()の間でドキュメントを変更した場合はどうなりますか?
UpTheCreek 2013

3
正しいが、フィールド間でのコピーでは、トランザクションがアトミックである必要はありません。
UpTheCreek 2013

3
save()がドキュメントを完全に置き換えることに注意することが重要です。update()代わりに使用する必要があります。
Carlos

12
どうですかdb.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );
フィリップジャルダ

1
この方法でcreate_guid反復するときに、ドキュメントごとに一意のGUIDのみを生成するという関数を作成しましたforEach(つまりcreate_guidupdateステートメントで単に使用mutli=trueすると、すべてのドキュメントに対して同じGUIDが生成されます)。この答えは私にはぴったりでした。+1
rmir​​abelle 2015

103

MongoDB 3.4以降、これを効率的に行う方法があるようです。styvaneの回答を参照してください。


以下の時代遅れの答え

(まだ)更新でドキュメント自体を参照することはできません。ドキュメントを反復処理し、関数を使用して各ドキュメントを更新する必要があります。参照してくださいこの回答例えば、またはこのいずれかのサーバー側のためにeval()


31
これは今日でも有効ですか?
クリスチャンエンゲル2013年

3
@ChristianEngel:そのように見えます。update操作で現在のドキュメントへの参照について言及しているMongoDBドキュメントで何も見つかりませんでした。この関連機能のリクエストも未解決のままです。
Niels van der Rest

4
2017年4月も有効ですか?またはこれを行うことができる新しい機能はすでにありますか?
キム

1
@キムそれはまだ有効なようです。また、@ niels-van-der-restが2013年に指摘した機能のリクエストはまだ残っていOPENます。
Danziger、2017年

8
これはもう有効な回答ではありません。@ styvaneの回答をご覧ください
aitchkhan

45

アクティビティの多いデータベースでは、更新がアクティブに変化するレコードに影響するという問題が発生する可能性があるため、snapshot()の使用をお勧めします

db.person.find().snapshot().forEach( function (hombre) {
    hombre.name = hombre.firstName + ' ' + hombre.lastName; 
    db.person.save(hombre); 
});

http://docs.mongodb.org/manual/reference/method/cursor.snapshot/


2
別のユーザーがfind()とsave()の間でユーザーを編集した場合はどうなりますか?現在の値に基づいてそれらを変更する同じオブジェクトに対して複数の呼び出しを実行できる場合があります。2番目のユーザーは、1番目のユーザーが保存を完了するまで、読み取りを待つ必要があります。これで達成できますか?
Marco

4
についてsnapshot()Deprecated in the mongo Shell since v3.2. Starting in v3.2, the $snapshot operator is deprecated in the mongo shell. In the mongo shell, use cursor.snapshot() instead. リンク
ppython

10

この回答によれば、このアップデートによると、スナップショット機能はバージョン3.6で廃止されています。したがって、バージョン3.6以降では、次のように操作を実行できます。

db.person.find().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

9

を開始するMongo 4.2db.collection.update()、集約パイプラインを受け入れることができ、最終的に別のフィールドに基づくフィールドの更新/作成が可能になります。

// { firstName: "Hello", lastName: "World" }
db.collection.update(
  {},
  [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
  { multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
  • 最初の部分{}は一致クエリで、更新するドキュメント(この場合はすべてのドキュメント)をフィルタリングします。

  • 2番目の部分[{ $set: { name: { ... } }]は、更新集約パイプラインです(角括弧が集約パイプラインの使用を示すことに注意してください)。$set新しい集計演算子であり、のエイリアスです$addFields

  • 忘れないでください{ multi: true }。そうしないと、最初に一致したドキュメントのみが更新されます。


8

上記の解決策を試しましたが、大量のデータには適していません。次に、ストリーム機能を発見しました:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})

1
これはどう違うのですか?更新アクティビティによって蒸気が抑制されますか?それについて何か言及はありますか?Mongoのドキュメントはかなり貧弱です。
Nico

2

以下は、1つのフィールドを別のフィールドにコピーして、最大150_000レコードにするために思いついたものです。所要時間は約6分ですが、同じ数のルビーオブジェクトをインスタンス化して繰り返し処理する場合よりも、リソースの消費量が大幅に少なくなります。

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)

1

MongoDBのバージョン4.2以降、更新は、その中に凝集パイプラインの使用を可能にするように、より柔軟性がありupdateupdateOneそしてupdateMany。これで、集計演算子を使用してドキュメントを変換し、$setコマンドを明示的に記述する必要なく更新できます(代わりにを使用します$replaceRoot: {newRoot: "$$ROOT"}

ここでは、集約クエリを使用してMongoDBのObjectID "_id"フィールドからタイムスタンプを抽出し、ドキュメントを更新しています(SQLの専門家ではありませんが、SQLはタイムスタンプを持つ自動生成されたObjectIDを提供していないと思います。その日付を自動的に作成します)

var collection = "person"

agg_query = [
    {
        "$addFields" : {
            "_last_updated" : {
                "$toDate" : "$_id"
            }
        }
    },
    {
        $replaceRoot: {
            newRoot: "$$ROOT"
        } 
    }
]

db.getCollection(collection).updateMany({}, agg_query, {upsert: true})

あなたは必要ありません{ $replaceRoot: { newRoot: "$$ROOT" } }。それは文書をそれ自体で置き換えることを意味します、それは無意味です。あなたが交換した場合は$addFields、その別名で$setupdateManyの別名の一つでありupdate、あなたはとまったく同じ答えを得る。この1以上。
ザビエルギホ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.