公開日:2019-08-15
最終更新日:2019-08-26
最終更新日:2019-08-26
np09-0:準備
以下のデータをdata
ディレクトリに配置したうえで,次のコードを実行しよう.
grade.csv
:学生の段階評価(学籍番号id
,段階評価raw_grade
)
1 2 3 4 |
>>> import numpy as np >>> import pandas as pd >>> >>> df = pd.read_csv('data/grade.csv', index_col=0) |
pd09-1:データフレームへのカテゴリカルデータの列の追加
df
の'raw_grade'
列を基にカテゴリカルデータとして'grade'
列を追加しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.astype() メソッドを使う. |
pd09-2:カテゴリカルデータの内容の表示
df
に追加した'grade'
列の内容を表示しよう.
難易度:★
ミッション | 説明 |
---|---|
1 | print() 関数を使う. |
pd09-3:カテゴリ名の変更
'grade'
列のカテゴリ名を変更しよう.ここで,'S'->'秀', 'A'->'優', 'B'->'良', 'C'->'可'
とする.
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.cat.categories 属性を使う. |
pd09-4:カテゴリの順序の変更
'grade'
列のカテゴリを'秀', '優', '良', '可', '不可'
の順に変更しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.cat.set_categories() メソッドを使う. |
pd09-5:カテゴリの昇順に表示
df
を'grade'
の昇順に表示しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.sort_values() メソッドを使う. |
2 | by パラメタを指定する. |
pd09-6:カテゴリ別の集計
df
内の'grade'
別の人数を表示しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.groupby() メソッドを使う. |
2 | DataFrameGroupBy.size() メソッドを使う. |