公開日:2019-08-15
最終更新日:2019-08-26
最終更新日:2019-08-26
pd04-0:準備
以下のデータをdataディレクトリに配置したうえで,次のコードを実行しよう.
students.csv:学生の科目別成績(学籍番号id,基礎セミナーの得点SEM,データ構造とアルゴリズムの得点DSA,オブジェクト指向プログラミングの得点OOP)
|
1 2 3 4 |
>>> import numpy as np >>> import pandas as pd >>> >>> df = pd.read_csv('data/students.csv', index_col=0) |
pd04-1:列ごとの平均
dfにおいて科目ごとの平均得点を表示しよう.
難易度:★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.mean()メソッドを使う. |
pd04-2:行ごとの平均
dfにおいて学生ごとの平均得点を表示しよう.
難易度:★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.mean()メソッドを使う. |
pd04-3:列ごとの最大値と最小値の差
dfにおいて科目ごとに最高得点と最低得点の差を出力しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.apply()メソッドを使う. |
| 2 | ラムダ式を使う. |
pd04-4:値の分布
dfにおいて'OOP'の得点分布を出力しよう.
難易度:★
| ミッション | 説明 |
|---|---|
| 1 | Series.value_counts()メソッドを使う. |
pd04-5:文字列の小文字への変換
次のidsは学籍番号をシリーズとして取得したものである.idsの学籍番号T***を小文字のt***に変換して出力しよう.
|
1 |
>>> ids = df.index |
難易度:★
| ミッション | 説明 |
|---|---|
| 1 | Series.str.lower()メソッドを使う. |