列Aに繰り返し値があるデータフレームがあります。重複を削除して、列Bの値が最も高い行を維持します。
したがって、この:
A B
1 10
1 20
2 30
2 40
3 10
これに変わるはずです:
A B
1 20
2 40
3 10
Wesは、重複を削除するためのいくつかの優れた機能を追加しました:http : //wesmckinney.com/blog/?p=340。ただし、AFAICT、完全に重複するように設計されているため、保持する行を選択する基準についての言及はありません。
おそらくこれを行う簡単な方法があると思います-重複を削除する前にデータフレームをソートするのと同じくらい簡単かもしれません-しかし、それを理解するのに十分なgroupbyの内部ロジックを知りません。助言がありますか?