GH開発マスターからSpark 1.4をビルドしましたが、ビルドは問題なく完了しました。しかし、私が実行するbin/pyspark
と、Python 2.7.9バージョンが取得されます。どうすれば変更できますか?
回答:
環境変数を設定するだけです:
export PYSPARK_PYTHON=python3
これを永続的な変更にしたい場合は、この行をpysparkスクリプトに追加します。
export PYSPARK_PYTHON=python3.5
Python 3.5 に使用
$SPARK_HOME/conf/spark-env.sh
ので、spark-submit
同様に同じインタプリタを使用しています。
PYSPARK_PYTHON=python3
./bin/pyspark
IPython Notebookで実行する場合は、次のように記述します。
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
python3
アクセスできない場合は、代わりにパスを渡す必要があります。
ことに注意してください(1.4.1のように)現在のドキュメントはに古い指示を持っています。幸い、パッチが適用されています。
ファイルを確認してください。シバン行はおそらく、最初の互換性のある実行可能ファイルのパスを検索する「env」バイナリをポイントしています。
pythonをpython3に変更できます。ハードコードされたpython3バイナリを直接使用するように環境を変更します。または、python3を使用してバイナリを直接実行し、shebang行を省略します。
PYSPARK_PYTHON
環境変数を設定する必要があります。
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
場合、IPython 3ノートブックを実行します。