您好,登录后才能下订单哦!
本篇内容介绍了“数据库中怎么批量处理分析数据”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
需求
:有20个品牌共生产了127个类目的产品,筛选出近一年销售额总额TOP5的品牌
以及对应的销售额。
思路
:先做第一个然后如法炮制将结果汇总即可。
数据信息如下:
加载数据:
接着,是要汇总不同品牌在这个细分行业下的销售额,我们要汇总的是各品牌近一年(2018年9月-2019年8月)的销售额,先看看日期是否正确:
每个品牌每个月份销售额计算如下:
按照品牌分组计算销售额总和前五的品牌:
这里有个细节,最终要汇总的是所有细分行业的销售额top5,给所属类别添加标签。
最终最终结果:
import time start = time.time()result = pd.DataFrame()for name in os.listdir():df = pd.read_excel(name)df['销售额']= df['访客数']* df['转化率']*df['客单价']df_sum = df.groupby('品牌',)['销售额'].sum().reset_index()df_sum['类目'] = name.replace(".xlsx","")result = pd.concat([result,df_sum])final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额',ascending=False)final.head()
看起来很奇怪的销售额,是pandas自作主张把实际销售额变成了 科学记数法 形式来展示,要还原数值,需要更改一下原始的设置:
“数据库中怎么批量处理分析数据”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。