ここでの質問の核心は、ワークフロー内のどのタスクが実際にArcGISに依存していないかだと思います。明らかな候補には、表形式およびラスター操作が含まれます。データがgdbまたは他のESRI形式内で開始および終了する必要がある場合、この再フォーマットのコストを最小化する方法(つまり、往復回数を最小化する方法)を把握する必要があります。合理化するには費用がかかります。もう1つの方法は、Pythonに適したデータモデルを以前に使用するようにワークフローを変更することです(たとえば、ベクターポリゴンをどれだけ早く捨てることができますか?)。
@geneをエコーするには、numpy / scipyは本当に優れていますが、これらが利用可能な唯一のアプローチであると想定しないでください。リスト、セット、辞書を代替構造として使用することもできますが(@ blah238のリンクは効率の違いについてはかなり明確ですが)、ジェネレーター、イテレーター、およびこれらの構造をPythonで操作するためのその他のあらゆる種類の高速で効率的なツールもあります。Python開発者の1人であるRaymond Hettingerは、あらゆる種類の優れた一般的なPythonコンテンツを公開しています。このビデオは良い例です。
また、多重化処理に関する@ blah238のアイデアに追加するために、IPython内(「通常の」Python環境だけでなく)で書き込み/実行している場合、複数のコアを活用するために「パラレル」パッケージを使用できます。私はこのようなことを気にすることはありませんが、マルチプロセッシングのものよりも少し高レベル/初心者向けです。おそらく本当にそこの個人的な宗教の問題なので、一粒の塩でそれを取ってください。このビデオの2:13:00から始まる概要については、良い概要があります。ビデオ全体は、一般的にIPythonに最適です。