怎么使用Python的Pandas布尔索引

发布时间:2021-11-19 15:27:46 作者:iii
来源:亿速云 阅读:344

这篇文章主要讲解了“怎么使用Python的Pandas布尔索引”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python的Pandas布尔索引”吧!

1.计算布尔值统计信息

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#判断电影时长是否超过两个小时 #Figure1
movie_2_hours = movie['duration'] > 120
#统计时长超过两小时的电影总数
print(movie_2_hours.sum()) #result:1039
#统计时长超过两小时的电影的比例
print(movie_2_hours.mean())
#统计False和True的比例 
print(movie_2_hours.value_counts(normalize = True)) 
#比较同一个DataFrame中的两列
actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna()
print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2

运行结果:

怎么使用Python的Pandas布尔索引

Figure1

怎么使用Python的Pandas布尔索引

Figure2

2. 构建多个布尔条件

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建多个布尔条件
criteria1 = movie.imdb_score > 8
criteria2 = movie.content_rating == "PG-13"
criteria3 = (movie.title_year < 2000) | (movie.title_year >= 2010)
"""
print(criteria1.head())
print(criteria2.head())
print(criteria3.head())
运行结果:Figure1
"""
#将多个布尔条件合并成一个
criteria_final = criteria1 & criteria2 & criteria3 
print(criteria_final.head())
#运行结果:Figure2

运行结果:

怎么使用Python的Pandas布尔索引

Figure1

怎么使用Python的Pandas布尔索引

Figure2

3.用布尔索引过滤

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建第一个布尔条件
crit_a1 = movie.imdb_score > 8 
crit_a2 = movie.content_rating == 'PG-13'
crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)
final_crit_a = crit_a1 & crit_a2 & crit_a3
#创建第二个布尔条件
crit_b1 = movie.imdb_score < 5
crit_b2 = movie.content_rating == 'R'
crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)
final_crit_b = crit_b1 & crit_b2 & crit_b3
#将两个条件用或运算合并起来
final_crit_all = final_crit_a | final_crit_b
print(final_crit_all.head()) #Figure 1 
#用最终的布尔条件过滤数据
print(movie[final_crit_all].head()) #Figure2

运行结果:

怎么使用Python的Pandas布尔索引

Figure1

怎么使用Python的Pandas布尔索引

Figure2

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建第一个布尔条件
crit_a1 = movie.imdb_score > 8 
crit_a2 = movie.content_rating == 'PG-13'
crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)
final_crit_a = crit_a1 & crit_a2 & crit_a3
#创建第二个布尔条件
crit_b1 = movie.imdb_score < 5
crit_b2 = movie.content_rating == 'R'
crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)
final_crit_b = crit_b1 & crit_b2 & crit_b3
#将两个条件用或运算合并起来
final_crit_all = final_crit_a | final_crit_b
#使用loc,对指定的列做过滤操作,可以清楚地看到过滤是否起作用
cols = ['imdb_score','content_rating','title_year']
movie_filtered = movie.loc[final_crit_all,cols]
print(movie_filtered.head(10))

运行结果:

怎么使用Python的Pandas布尔索引

感谢各位的阅读,以上就是“怎么使用Python的Pandas布尔索引”的内容了,经过本文的学习后,相信大家对怎么使用Python的Pandas布尔索引这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

推荐阅读:
  1. pandas的索引操作
  2. 使用pandas怎么层次化索引

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

pandas python

上一篇:Python+Selenium+phantomjs怎么实现网页模拟登录和截图

下一篇:Python有哪些模块

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》