第4章：データの演算 | 推薦システム研究室（RecSysLab）

公開日：2019-08-15
最終更新日：2019-08-26

pd04-0：準備

students.csv：学生の科目別成績（学籍番号id，基礎セミナーの得点SEM，データ構造とアルゴリズムの得点DSA，オブジェクト指向プログラミングの得点OOP）

>>> import numpy as np

>>> import pandas as pd

>>>

>>> df = pd.read_csv('data/students.csv', index_col=0)

pd04-1：列ごとの平均

難易度：★

ミッション	説明
1	`DataFrame.mean()`メソッドを使う．

pd04-2：行ごとの平均

難易度：★

ミッション	説明
1	`DataFrame.mean()`メソッドを使う．

pd04-3：列ごとの最大値と最小値の差

難易度：★★

ミッション	説明
1	`DataFrame.apply()`メソッドを使う．
2	ラムダ式を使う．

pd04-4：値の分布

難易度：★

ミッション	説明
1	`Series.value_counts()`メソッドを使う．

pd04-5：文字列の小文字への変換

1	>>> ids = df.index

難易度：★

ミッション	説明
1	`Series.str.lower()`メソッドを使う．