第9章:カテゴリカルデータ

公開日:2019-08-15
最終更新日:2019-08-26

np09-0:準備
以下のデータをdataディレクトリに配置したうえで,次のコードを実行しよう.
  • grade.csv:学生の段階評価(学籍番号id,段階評価raw_grade

pd09-1:データフレームへのカテゴリカルデータの列の追加
df'raw_grade'列を基にカテゴリカルデータとして'grade'列を追加しよう.
難易度:★★
ミッション 説明
1 DataFrame.astype()メソッドを使う.

pd09-2:カテゴリカルデータの内容の表示
dfに追加した'grade'列の内容を表示しよう.
難易度:★
ミッション 説明
1 print()関数を使う.

pd09-3:カテゴリ名の変更
'grade'列のカテゴリ名を変更しよう.ここで,'S'->'秀', 'A'->'優', 'B'->'良', 'C'->'可'とする.
難易度:★★
ミッション 説明
1 DataFrame.cat.categories属性を使う.

pd09-4:カテゴリの順序の変更
'grade'列のカテゴリを'秀', '優', '良', '可', '不可'の順に変更しよう.
難易度:★★
ミッション 説明
1 DataFrame.cat.set_categories()メソッドを使う.

pd09-5:カテゴリの昇順に表示
df'grade'の昇順に表示しよう.
難易度:★★
ミッション 説明
1 DataFrame.sort_values()メソッドを使う.
2 byパラメタを指定する.

pd09-6:カテゴリ別の集計
df内の'grade'別の人数を表示しよう.
難易度:★★
ミッション 説明
1 DataFrame.groupby()メソッドを使う.
2 DataFrameGroupBy.size()メソッドを使う.