第5章:マージ

公開日:2019-08-15
最終更新日:2019-08-27

pd05-0:準備
以下のデータをdataディレクトリに配置したうえで,次のコードを実行しよう.
  • users.csv:ユーザ(ユーザIDuser_id,ユーザ名name
  • items.csv:商品(商品IDitem_id,商品名name,価格price
  • purchases.csv:購入履歴(購入IDpurchase_id,ユーザIDuser_id,商品IDitem_id,個数amount
  • purchases2.csv:購入履歴(購入IDpurchase_id,ユーザIDuser_id,商品IDitem_id,個数amount

pd05-1:データフレームの縦方向の連結
purchasespurchases2を縦方向に連結しよう.
難易度:★★
ミッション 説明
1 pandas.concat()関数を使う.

pd05-2:データフレームの結合(1)
purchasesusers'user_id'をキーとして結合しよう.
難易度:★★
ミッション 説明
1 pandas.merge()関数を使う.
2 onパラメタを指定する.
3 結合したデータフレームをpurchases_usersとする.

pd05-3:データフレームの結合(2)
purchases_usersitems'item_id'をキーとして結合しよう.
難易度:★★
ミッション 説明
1 pandas.merge()関数を使う.
2 onパラメタを指定する.

pd05-4:データフレームへのシリーズの追加
Aliceは新たにぶどうを3個購入した.次のシリーズspurchasesに追加しよう.

難易度:★★
ミッション 説明
1 DataFrame.append()メソッドを使う.
2 ignore_indexパラメタを指定する.