大きなデータフレームの出力全体を表示する理由はありません。大きなデータフレームを表示または操作すると、大量のコンピュータリソースが不必要に使用されます。
あなたがしていることは何でもミニチュアで行うことができます。データフレームが小さい場合、データのコーディングと操作ははるかに簡単です。ビッグデータを扱う最良の方法は、大きなデータフレームの小さな部分または小さなサンプルのみを使用する新しいデータフレームを作成することです。次に、データを探索し、より小さなデータフレームでコーディングを行うことができます。データを調べてコードを機能させることができたら、そのコードをより大きなデータフレームで使用します。
最も簡単な方法は、head()関数を使用して、データフレームから最初のnの最初の行の数を取得することです。head関数は、n行のみを出力します。大きなデータフレームで関数headを使用して、ミニデータフレームを作成できます。以下では、最初の50行を選択し、その値をsmall_dfに渡します。これは、BigDataが、このプロジェクト用に開いたライブラリからのデータファイルであることを前提としています。
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
これはほとんどの場合機能しますが、ビッグデータフレームには、事前にソートされた変数またはすでにグループ化された変数が付属している場合があります。ビッグデータがこのような場合、ビッグデータから行のランダムなサンプルを取得する必要があります。次に、次のコードを使用します。
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df