Google App Engineですべてのデータストアを削除する方法を知っている人はいますか?
/path/to/google_appengine/dev_appserver.py --clear_datastore yes myappname/ は、コマンドプロンプトで次のコマンドを発行します。myappnameは、アプリのapp.yamlファイルを含むディレクトリです。このディレクトリパスにcdする必要があります。クレジット:下記の回答のSteven AlmerothとMelllvar
Google App Engineですべてのデータストアを削除する方法を知っている人はいますか?
/path/to/google_appengine/dev_appserver.py --clear_datastore yes myappname/ は、コマンドプロンプトで次のコマンドを発行します。myappnameは、アプリのapp.yamlファイルを含むディレクトリです。このディレクトリパスにcdする必要があります。クレジット:下記の回答のSteven AlmerothとMelllvar
回答:
ライブデータストアについて話している場合は、アプリのダッシュボードを開き(appengineにログイン)、次にdatastore-> dataviewerを実行して、削除するテーブルのすべての行を選択し、削除ボタンをクリックします(必要です)すべてのテーブルでこれを行います)。プログラムで、remote_apiを使用して同じことを実行できます(ただし、私は使用していません)。
あなたが話をしている場合は、開発データストア:、あなただけの次のファイルを削除する必要があります「./WEB-INF/appengine-generated/local_db.binを」。このファイルは、次に開発サーバーを実行したときに再び生成され、clear dbが作成されます。
後でプロジェクトを必ずクリーンアップしてください。
これは、Google Application Engineを使い始めるときに役立つ、ちょっとした落とし穴の1つです。オブジェクトをデータストアに永続化し、永続化可能なエンティティのJDOオブジェクトモデルを変更すると、アプリがいたるところにクラッシュする古いデータになってしまいます。
Nickが提案したリモートAPIメソッドが最善のアプローチです。彼はGoogleのApp Engineエンジニアなので、信頼してください。
それほど難しくはありません。最新の1.2.5 SDKは、既製のremote_shell_api.pyを提供します。新しいSDKをダウンロードしてください。次に、次の手順に従います。
コマンドラインでリモートサーバーに接続しますremote_shell_api.py yourapp /remote_api
。シェルはログイン情報を要求し、許可されている場合は、Pythonシェルを作成します。app.yamlの/ remote_apiのセットアップURLハンドラーが必要です
削除するエンティティをフェッチすると、コードは次のようになります。
from models import Entry query = Entry.all(keys_only=True) entries =query.fetch(1000) db.delete(entries) \# This could bulk delete 1000 entities a time
2013-10-28更新:
remote_shell_api.pyに置き換えられました。ドキュメントによるremote_api_shell.pyとremote_api_shell.py -s your_app_id.appspot.com、に接続する必要があります。
新しい実験的な機能Datastore Adminがあり、アプリ設定で有効にした後、ウェブUIを介してデータストアを一括削除したりバックアップしたりできます。
Datastoreで一括削除を処理する最も速く効率的な方法は、最新のGoogle I / Oで発表された新しいマッパーAPIを使用することです。
選択した言語がPythonの場合、マッパーをmapreduce.yamlファイルに登録し、次のような関数を定義するだけです。
from mapreduce import operation as op
def process(entity):
yield op.db.Delete(entity)
でJavaのあなたのを見ている必要があり、この記事のような機能を示唆しています:
@Override
public void map(Key key, Entity value, Context context) {
log.info("Adding key to deletion pool: " + key);
DatastoreMutationPool mutationPool = this.getAppEngineContext(context)
.getMutationPool();
mutationPool.delete(value.getKey());
}
編集:
SDK 1.3.8以降、この目的のためのデータストア管理機能があります
サーバーを実行するときに、開発サーバーのデータストアをクリアできます。
/path/to/dev_appserver.py --clear_datastore=yes myapp
あなたも短縮することができます--clear_datastoreし-c。
/path/to/google_appengine/dev_appserver.py --clear_datastore yes myappname/
App Engineのデータストアからエントリを削除するには、いくつかの方法があります。

まず、本当にエントリを削除する必要があるかどうかを考えます。これは高価であり、それらを削除しない方が安くなる可能性があります。
データストア管理を使用して、すべてのエントリを手動で削除できます。
リモートAPIを使用して、エントリをインタラクティブに削除できます。
数行のコードを使用して、プログラムでエントリを削除できます。
タスクキューとカーソルを使用して、それらをまとめて削除できます。
または、Mapreduceを使用して、より堅牢で洗練されたものを取得することもできます。
これらの各方法については、次のブログ投稿で説明されています。http: //www.shiftedup.com/2015/03/28/how-to-bulk-delete-entries-in-app-engine-datastore
それが役に立てば幸い!
これを行うためのゼロセットアップの方法は、実行中のアプリがすでに自動的に持っている管理サービスに、execute-arbitrary-code HTTPリクエストを送信することです。
import urllib
import urllib2
urllib2.urlopen('http://localhost:8080/_ah/admin/interactive/execute',
data = urllib.urlencode({'code' : 'from google.appengine.ext import db\n' +
'db.delete(db.Query())'}))
私はこれを手に入れました http://code.google.com/appengine/articles/remote_api.html。
まず、インタラクティブなappengingeコンソールを定義する必要があります。したがって、appengine_console.pyというファイルを作成し、次のように入力します。
#!/usr/bin/python
import code
import getpass
import sys
# These are for my OSX installation. Change it to match your google_appengine paths. sys.path.append("/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine")
sys.path.append("/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/lib/yaml/lib")
from google.appengine.ext.remote_api import remote_api_stub
from google.appengine.ext import db
def auth_func():
return raw_input('Username:'), getpass.getpass('Password:')
if len(sys.argv) < 2:
print "Usage: %s app_id [host]" % (sys.argv[0],)
app_id = sys.argv[1]
if len(sys.argv) > 2:
host = sys.argv[2]
else:
host = '%s.appspot.com' % app_id
remote_api_stub.ConfigureRemoteDatastore(app_id, '/remote_api', auth_func, host)
code.interact('App Engine interactive console for %s' % (app_id,), None, locals())
準備ができたら、このMapperクラスを作成します。私はutils.pyという新しいファイルを作成し、これをスローしました:
class Mapper(object):
# Subclasses should replace this with a model class (eg, model.Person).
KIND = None
# Subclasses can replace this with a list of (property, value) tuples to filter by.
FILTERS = []
def map(self, entity):
"""Updates a single entity.
Implementers should return a tuple containing two iterables (to_update, to_delete).
"""
return ([], [])
def get_query(self):
"""Returns a query over the specified kind, with any appropriate filters applied."""
q = self.KIND.all()
for prop, value in self.FILTERS:
q.filter("%s =" % prop, value)
q.order("__key__")
return q
def run(self, batch_size=100):
"""Executes the map procedure over all matching entities."""
q = self.get_query()
entities = q.fetch(batch_size)
while entities:
to_put = []
to_delete = []
for entity in entities:
map_updates, map_deletes = self.map(entity)
to_put.extend(map_updates)
to_delete.extend(map_deletes)
if to_put:
db.put(to_put)
if to_delete:
db.delete(to_delete)
q = self.get_query()
q.filter("__key__ >", entities[-1].key())
entities = q.fetch(batch_size)
Mapperは、特定の種類のすべてのエンティティを反復処理できる抽象クラスであると想定されています。データを抽出したり、エンティティを変更して更新されたエンティティをデータストアに格納したりできます。
次に、appengineインタラクティブコンソールを起動します。
$python appengine_console.py <app_id_here>
インタラクティブコンソールが起動します。その中にModelのサブクラスを作成します:
from utils import Mapper
# import your model class here
class MyModelDeleter(Mapper):
KIND = <model_name_here>
def map(self, entity):
return ([], [entity])
そして最後に、(インタラクティブコンソールから)実行します。mapper = MyModelDeleter()mapper.run()
それでおしまい!
デプロイしたApp Engineアプリで使用できるアドインパネルを作成しました。ドロップダウンにデータストアに存在する種類が一覧表示され、ボタンをクリックして、特定の種類のすべてのエンティティまたは単にすべてを削除する「タスク」をスケジュールできます。こちらからダウンロードできます:http :
//code.google.com/p/jobfeed/wiki/Nuke
Pythonの場合、1.3.8には、このための実験的な管理機能が組み込まれています。彼らは言う:「あなたのapp.yamlファイルで次の組み込みを有効にしてください:」
builtins:
- datastore_admin: on
「データストアの削除は現在、Pythonランタイムでのみ使用できます。ただし、Javaアプリケーションは、app.yamlでデータストア管理を有効にするデフォルト以外のPythonアプリケーションバージョンを作成することで、この機能を利用できます。Javaのネイティブサポートが含まれます今後のリリースで。」
これはあなたが探しているものです...
db.delete(Entry.all(keys_only=True))
キーのみのクエリの実行はフルフェッチよりもはるかに高速で、キーのみのクエリは小さな演算と見なされるため、割り当てはより小さなヒットになります。
Nick Johnsonからの回答へのリンクを次に示します。
以下は、テーブルを切り捨てるためのエンドツーエンドのREST APIソリューションです...
REST APIをセットアップして、ルートが適切なモデル/アクションに直接マップされるデータベーストランザクションを処理します。これは、正しいURL(example.com/inventory/truncate)を入力してログインすることで呼び出すことができます。
ルートは次のとおりです。
Route('/inventory/truncate', DataHandler, defaults={'_model':'Inventory', '_action':'truncate'})
ここにハンドラがあります:
class DataHandler(webapp2.RequestHandler):
@basic_auth
def delete(self, **defaults):
model = defaults.get('_model')
action = defaults.get('_action')
module = __import__('api.models', fromlist=[model])
model_instance = getattr(module, model)()
result = getattr(model_instance, action)()
まず、モデル(つまり、api.modelsの下にあるInventory)を動的にロードし、次にactionパラメーターで指定されている正しいメソッド(Inventory.truncate())を呼び出します。
@basic_authは、機密操作(POST / DELETEなど)の認証を提供するデコレータ/ラッパーです。セキュリティが心配な場合は、oAuthデコレーターも利用できます。
最後に、アクションが呼び出されます:
def truncate(self):
db.delete(Inventory.all(keys_only=True))
魔法のように見えますが、実際には非常に簡単です。最も良い点は、delete()を再利用して、モデルに別のアクションを追加することで、1つまたは複数の結果の削除を処理できることです。
すべてのデータストアを削除するには、すべての種類を1つずつ削除します。google appengineダッシュボード。次の手順に従ってください。
詳細については、この画像を参照してくださいhttp://storage.googleapis.com/bnifsc/Screenshot%20from%202015-01-31%2023%3A58%3A41.png
大量のデータがある場合、Webインターフェースの使用には時間がかかる可能性があります。App Engineのランチャーユーティリティは、チェックボックス「起動時にクリアデータストア」であなた一度で削除すべてのことができます。このユーティリティは、WindowsとMac(Pythonフレームワーク)の両方で使用できるようになりました。
開発サーバーの場合、Google App Engineランチャーを介してサーバーを実行する代わりに、ターミナルから次のように実行できます。
dev_appserver.py --port = [portnumber] --clear_datastore = yes [nameofapplication]
例:アプリケーション「リーダー」はポート15080で実行されます。コードを変更してサーバーを再起動したら、「dev_appserver.py --port = 15080 --clear_datastore = yes reader」を実行します。
それは私にとって良いことです。
最近の進展に関する回答を追加します。
Googleは最近、データストア管理機能を追加しました。このコンソールを使用して、エンティティをバックアップ、削除、または別のアプリにコピーできます。
https://developers.google.com/appengine/docs/adminconsole/datastoreadmin#Deleting_Entities_in_Bulk
PHPバリエーション:
import com.google.appengine.api.datastore.Query;
import com.google.appengine.api.datastore.DatastoreServiceFactory;
define('DATASTORE_SERVICE', DatastoreServiceFactory::getDatastoreService());
function get_all($kind) {
$query = new Query($kind);
$prepared = DATASTORE_SERVICE->prepare($query);
return $prepared->asIterable();
}
function delete_all($kind, $amount = 0) {
if ($entities = get_all($kind)) {
$r = $t = 0;
$delete = array();
foreach ($entities as $entity) {
if ($r < 500) {
$delete[] = $entity->getKey();
} else {
DATASTORE_SERVICE->delete($delete);
$delete = array();
$r = -1;
}
$r++; $t++;
if ($amount && $amount < $t) break;
}
if ($delete) {
DATASTORE_SERVICE->delete($delete);
}
}
}
はい、それは時間と30秒かかります。限界です。ajaxアプリのサンプルを30秒を超えて自動化することを考えています。
import?定数をオブジェクトインスタンスとして定義しますか?
ndbを使用している場合、データストアをクリアするために私のために働いた方法:
ndb.delete_multi(ndb.Query(default_options=ndb.QueryOptions(keys_only=True)))
Sorry, unexpected error: The kind "__Stat_Kind__" is reserved.これについて不平を言うappengineには、このメソッドによって公開される可能性のある内部統計エンティティーがあるようです(最後にバグの可能性がありますか?)
ローカルではなくApp Engine上にあるデータストアの場合は、新しいDatastore APIを使用できます。ここだ開始する方法のためのプライマーは。
ビルトインされていないエンティティをすべて削除するスクリプトを書きました。APIはかなり急速に変化しているので、参考のために、コミット990ab5c7f2063e8147bcc56ee222836fd3d6e15bで複製しました。
from gcloud import datastore
from gcloud.datastore import SCOPE
from gcloud.datastore.connection import Connection
from gcloud.datastore import query
from oauth2client import client
def get_connection():
client_email = 'XXXXXXXX@developer.gserviceaccount.com'
private_key_string = open('/path/to/yourfile.p12', 'rb').read()
svc_account_credentials = client.SignedJwtAssertionCredentials(
service_account_name=client_email,
private_key=private_key_string,
scope=SCOPE)
return Connection(credentials=svc_account_credentials)
def connect_to_dataset(dataset_id):
connection = get_connection()
datastore.set_default_connection(connection)
datastore.set_default_dataset_id(dataset_id)
if __name__ == "__main__":
connect_to_dataset(DATASET_NAME)
gae_entity_query = query.Query()
gae_entity_query.keys_only()
for entity in gae_entity_query.fetch():
if entity.kind[0] != '_':
print entity.kind
entity.key.delete()
svpinoの考えを続けると、削除としてマークされたレコードを再利用するのが賢明です。(彼のアイデアは削除することではなく、「削除された」未使用のレコードとしてマークすることでした)。作業コピーを処理し、状態の違いのみ(目的のタスクの前後)をデータストアに書き込むための少しのキャッシュ/ memcacheは、データストアをより良くします。大きなタスクの場合、memcacheが消えた場合のデータ損失を回避するために、データストアに差分差分チャンクを書き込むことが可能です。損失を防ぐために、memcachedの結果の整合性/存在を確認し、タスク(または必要な部分)を再起動して、不足している計算を繰り返すことができます。データの差分がデータストアに書き込まれると、必要な計算がキューで破棄されます。
マップの縮小に似た他のアイデアは、エンティティの種類をいくつかの異なるエンティティの種類に分割することです。そのため、エンティティはまとめて収集され、単一のエンティティの種類として最終ユーザーに表示されます。エントリは「削除済み」としてのみマークされます。シャードあたりの「削除された」エントリの量が制限を超えると、「生きた」エントリが他のシャードに分散され、このシャードは永久に閉じられ、開発コンソールから手動で削除されます(少ないコストで)更新:コンソールにドロップテーブルがないようです通常の価格でレコードごとにのみ削除します。
時間の経過時に次の試行を続行できるように、gaeが失敗することなく(少なくともローカルで機能します)、大量のレコードセットをチャンクごとにクエリで削除できます。
qdelete.getFetchPlan().setFetchSize(100);
while (true)
{
long result = qdelete.deletePersistentAll(candidates);
LOG.log(Level.INFO, String.format("deleted: %d", result));
if (result <= 0)
break;
}
開発サーバーの迅速なソリューションを必要とするすべての人(2016年2月の執筆時点):
これにより、データストアからすべてのデータがワイプされます。
ライブデータストアのすべてのデータを削除するための既存のソリューションにとても不満を感じていました、30秒以内にかなりの量のデータを削除できる小さなGAEアプリを作成しました。
etcのインストール方法:https : //github.com/xamde/xydra
あなたは2つの簡単な方法があります、
#1:コストを節約するには、プロジェクト全体を削除します
#2:ts-datastore-ormを使用する:
https://www.npmjs.com/package/ts-datastore-orm await Entity.truncate(); 切り捨てにより、1秒あたり約1K行を削除できます