第6章:グループ化

公開日:2019-08-15
最終更新日:2019-08-26

pd06-0:準備
以下のデータをdataディレクトリに配置したうえで,次のコードを実行しよう.
  • interleague.csv:2019年度プロ野球交流戦勝敗表(球団記号team,リーグleague,地区region,試合数games,勝利wins,敗北losses,引分draws

pd06-1:全データの列ごとの合計
全チームの'games', 'wins', 'losses', 'draws'の合計を算出しよう.
難易度:★★
ミッション 説明
1 DataFrame.sum()メソッドを使う.

pd06-2:グループ別の合計(1)
リーグ別('セ', 'パ')の'games', 'wins', 'losses', 'draws'の合計を算出しよう.
難易度:★★
ミッション 説明
1 DataFrame.groupby()メソッドを使う.
2 DataFrameGroupBy.sum()メソッドを使う.

pd06-3:グループ別の最大値
各リーグの最大勝利数を取得しよう.
難易度:★★
ミッション 説明
1 DataFrame.groupby()メソッドを使う.
2 DataFrameGroupBy.max()メソッドを使う.

pd06-4:グループ別の最小値
各リーグの最小勝利数を取得しよう.
難易度:★★
ミッション 説明
1 DataFrame.groupby()メソッドを使う.
2 DataFrameGroupBy.min()メソッドを使う.

pd06-5:グループ別の合計(2)
地域別('東', '西')の'games', 'wins', 'losses', 'draws'の合計を算出しよう.
難易度:★★
ミッション 説明
1 DataFrame.groupby()メソッドを使う.
2 DataFrameGroupBy.sum()メソッドを使う.

pd06-6:階層グループ別の合計
リーグかつ地域別('セ'-'東', 'セ'-'西', 'パ'-'東', 'パ'-'西')の'games', 'wins', 'losses', 'draws'の合計を算出しよう.
難易度:★★
ミッション 説明
1 DataFrame.groupby()メソッドを使う.
2 DataFrameGroupBy.sum()メソッドを使う.