公開日:2019-08-15
最終更新日:2019-08-26
最終更新日:2019-08-26
np09-0:準備
以下のデータをdataディレクトリに配置したうえで,次のコードを実行しよう.
grade.csv:学生の段階評価(学籍番号id,段階評価raw_grade)
|
1 2 3 4 |
>>> import numpy as np >>> import pandas as pd >>> >>> df = pd.read_csv('data/grade.csv', index_col=0) |
pd09-1:データフレームへのカテゴリカルデータの列の追加
dfの'raw_grade'列を基にカテゴリカルデータとして'grade'列を追加しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.astype()メソッドを使う. |
pd09-2:カテゴリカルデータの内容の表示
dfに追加した'grade'列の内容を表示しよう.
難易度:★
| ミッション | 説明 |
|---|---|
| 1 | print()関数を使う. |
pd09-3:カテゴリ名の変更
'grade'列のカテゴリ名を変更しよう.ここで,'S'->'秀', 'A'->'優', 'B'->'良', 'C'->'可'とする.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.cat.categories属性を使う. |
pd09-4:カテゴリの順序の変更
'grade'列のカテゴリを'秀', '優', '良', '可', '不可'の順に変更しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.cat.set_categories()メソッドを使う. |
pd09-5:カテゴリの昇順に表示
dfを'grade'の昇順に表示しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.sort_values()メソッドを使う. |
| 2 | byパラメタを指定する. |
pd09-6:カテゴリ別の集計
df内の'grade'別の人数を表示しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.groupby()メソッドを使う. |
| 2 | DataFrameGroupBy.size()メソッドを使う. |