公開日:2019-08-15
最終更新日:2019-08-27
最終更新日:2019-08-27
pd05-0:準備
以下のデータをdata
ディレクトリに配置したうえで,次のコードを実行しよう.
users.csv
:ユーザ(ユーザIDuser_id
,ユーザ名name
)items.csv
:商品(商品IDitem_id
,商品名name
,価格price
)purchases.csv
:購入履歴(購入IDpurchase_id
,ユーザIDuser_id
,商品IDitem_id
,個数amount
)purchases2.csv
:購入履歴(購入IDpurchase_id
,ユーザIDuser_id
,商品IDitem_id
,個数amount
)
1 2 3 4 5 6 7 |
>>> import numpy as np >>> import pandas as pd >>> >>> users = pd.read_csv('data/users.csv') >>> items = pd.read_csv('data/items.csv') >>> purchases = pd.read_csv('data/purchases.csv') >>> purchases2 = pd.read_csv('data/purchases2.csv') |
pd05-1:データフレームの縦方向の連結
purchases
とpurchases2
を縦方向に連結しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | pandas.concat() 関数を使う. |
pd05-2:データフレームの結合(1)
purchases
とusers
を'user_id'
をキーとして結合しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | pandas.merge() 関数を使う. |
2 | on パラメタを指定する. |
3 | 結合したデータフレームをpurchases_users とする. |
pd05-3:データフレームの結合(2)
purchases_users
とitems
を'item_id'
をキーとして結合しよう.
難易度:★★
ミッション | 説明 |
---|---|
1 | pandas.merge() 関数を使う. |
2 | on パラメタを指定する. |
pd05-4:データフレームへのシリーズの追加
Aliceは新たにぶどうを3個購入した.次のシリーズs
をpurchases
に追加しよう.
1 |
>>> s = pd.Series([21, 1, 5, 3], index=['purchase_id', 'user_id', 'item_id', 'amount']) |
難易度:★★
ミッション | 説明 |
---|---|
1 | DataFrame.append() メソッドを使う. |
2 | ignore_index パラメタを指定する. |