公開日:2019-08-15
最終更新日:2019-08-26
最終更新日:2019-08-26
pd04-0:準備
以下のデータをdata
ディレクトリに配置したうえで,次のコードを実行しよう.
students.csv
:学生の科目別成績(学籍番号id
,基礎セミナーの得点SEM
,データ構造とアルゴリズムの得点DSA
,オブジェクト指向プログラミングの得点OOP
)
1 2 3 4 |
>>> import numpy as np >>> import pandas as pd >>> >>> df = pd.read_csv('data/students.csv', index_col=0) |
pd04-1:列ごとの平均
df
において科目ごとの平均得点を表示しよう.
難易度:★
ミッション | 説明 |
---|---|
1 | DataFrame.mean() メソッドを使う. |
pd04-2:行ごとの平均
df
において学生ごとの平均得点を表示しよう.
難易度:★
ミッション | 説明 |
---|---|
1 | DataFrame.mean() メソッドを使う. |
pd04-3:列ごとの最大値と最小値の差
df
において科目ごとに最高得点と最低得点の差を出力しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.apply() メソッドを使う. |
2 | ラムダ式を使う. |
pd04-4:値の分布
df
において'OOP'
の得点分布を出力しよう.
難易度:★
ミッション | 説明 |
---|---|
1 | Series.value_counts() メソッドを使う. |
pd04-5:文字列の小文字への変換
次のids
は学籍番号をシリーズとして取得したものである.ids
の学籍番号T***
を小文字のt***
に変換して出力しよう.
1 |
>>> ids = df.index |
難易度:★
ミッション | 説明 |
---|---|
1 | Series.str.lower() メソッドを使う. |