公開日:2019-08-15
最終更新日:2019-08-27
最終更新日:2019-08-27
pd05-0:準備
以下のデータをdataディレクトリに配置したうえで,次のコードを実行しよう.
users.csv:ユーザ(ユーザIDuser_id,ユーザ名name)items.csv:商品(商品IDitem_id,商品名name,価格price)purchases.csv:購入履歴(購入IDpurchase_id,ユーザIDuser_id,商品IDitem_id,個数amount)purchases2.csv:購入履歴(購入IDpurchase_id,ユーザIDuser_id,商品IDitem_id,個数amount)
|
1 2 3 4 5 6 7 |
>>> import numpy as np >>> import pandas as pd >>> >>> users = pd.read_csv('data/users.csv') >>> items = pd.read_csv('data/items.csv') >>> purchases = pd.read_csv('data/purchases.csv') >>> purchases2 = pd.read_csv('data/purchases2.csv') |
pd05-1:データフレームの縦方向の連結
purchasesとpurchases2を縦方向に連結しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | pandas.concat()関数を使う. |
pd05-2:データフレームの結合(1)
purchasesとusersを'user_id'をキーとして結合しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | pandas.merge()関数を使う. |
| 2 | onパラメタを指定する. |
| 3 | 結合したデータフレームをpurchases_usersとする. |
pd05-3:データフレームの結合(2)
purchases_usersとitemsを'item_id'をキーとして結合しよう.
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | pandas.merge()関数を使う. |
| 2 | onパラメタを指定する. |
pd05-4:データフレームへのシリーズの追加
Aliceは新たにぶどうを3個購入した.次のシリーズsをpurchasesに追加しよう.
|
1 |
>>> s = pd.Series([21, 1, 5, 3], index=['purchase_id', 'user_id', 'item_id', 'amount']) |
難易度:★★
| ミッション | 説明 |
|---|---|
| 1 | DataFrame.append()メソッドを使う. |
| 2 | ignore_indexパラメタを指定する. |