1
Excelでデータを正規化して、Accessにインポートするときにデータセットが第3正規形に準拠するようにすることは可能ですか?
少し背景を説明するために、私は大学生でデータサイエンスの課題を担当しています。世界中のサッカー/サッカー選手に基づいたExcelのデータセットがあります。現在、各プレーヤーにはIDがあり、各レコードにはID、名前、クラブ、写真、年齢などが含まれています。 私が抱えている問題は、Accessでテーブルを設計するときに、Excelからデータをインポートできず、データが繰り返されるために正規化できないことです。 各プレーヤーにIDを割り当て、それを分割して(クラブ、プレーヤー、Player_Attributes、リーグ)のテーブルを作成しますが、17,000を超えるプレーヤーデータとそのクラブがあるため、手動で割り当てる必要があります。各一意のクラブはAccessのIDを使用し、Excelスプレッドシートからすべての繰り返しクラブを削除して、クラブの1つのインスタンスのみが「Club」テーブルに表示され、「Player」テーブルの「clubID」列がクラブテーブルにリンクするようにします。Excelで何かの繰り返しインスタンスをすべて自動的に削除し、その繰り返しを数字で置き換えてもいいですか? 申し訳ありませんが、私が質問を上手く伝えなかった場合、私を支援するためにさらなる説明が必要な場合はお知らせください 前もって感謝します 編集:(https://imgur.com/a/VJQmA)-Excel内にあるトップ4レコードのスクリーンショットへのリンク。ただし、スプレッドシートには17,000を超えるレコードが含まれています。