pandas基础操作

发布时间:2020-06-19 09:04:24 作者:boy12626
来源:网络 阅读:456

import pandas as pd

1、定义一个字典

data = {'sales_volume': [100, 123, 446, 233, 456], 'month': ['1月', '2月', '3月', '4月', '5月']

        , 'product_id': ['1112', '1113', '1114','1115','1116'], 'color':['red', 'red', 'black', 'green', 'black']}

2、将字典放入dataframe数据结构,自动生成一列数据做索引0-4

df = DataFrame(data)

print df

   color month product_id  sales_volume

0    red    1月       1112           100

1    red    2月       1113           123

2  black    3月       1114           446

3  green    4月       1115           233

4  black    5月       1116           456


3、将dataframe数据处理为字典格式

keys = list(df.keys())

values = df.values

print keys,values

dicts = [dict(zip(keys, value)) for value in values]

print dicts

[{'color': 'red', 'sales_volume': 100L, 'product_id': '1112', 'month': '1\xe6\x9c\x88'}, {'color': 'red', 'sales_volume': 123L, 'product_id': '1113', 'month': '2\xe6\x9c\x88'}, {'color': 'black', 'sales_volume': 446L, 'product_id': '1114', 'month': '3\xe6\x9c\x88'}, {'color': 'green', 'sales_volume': 233L, 'product_id': '1115', 'month': '4\xe6\x9c\x88'}, {'color': 'black', 'sales_volume': 456L, 'product_id': '1116', 'month': '5\xe6\x9c\x88'}]


4、通过groupy计算和,精确到color

print df.groupby(['product_id', 'color']).sum()

                  

product_id color    sales_volume            

1112       red              223

1113       black           446

               green          233

1116       black           456


推荐阅读:
  1. MongoDB基础操作
  2. Logstash基础操作-Filter

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

pandas

上一篇:MFA(Multi-Factor Authentication)应用之Radius认证

下一篇:自定义菜单,仿优酷菜单

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》