Python爬取并分析全球最美Top100女神榜单的数据

发布时间：2021-10-26 10:06:42 作者：柒染
来源：亿速云阅读：181

Python爬取并分析全球最美Top100女神榜单的数据，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

最近一段时间，国外媒体TOP BEAUTY WORLD选取了全球最帅男性和最美女性前100名，肖战成为了该排行榜历届以来首位登顶的亚洲人。这一消息立刻成为了流量的热点。

小编特地去查了一下，想看一下榜单中的最美小姐姐的信息。可是现在还没有最美小姐姐的文字榜单信息。但是小编却查到了2019年年底发布的上一届的全球最美女性前一百名的详细榜单，包含了姓名、国籍和职业等信息。

首先，我们要获取到想要的数据，包括小姐姐的照片，姓名以及国籍等信息。由于网页属于静态网页，因此可以直接分析网页源代码，获取到我们需要的数据即可。程序如下图所示：

Python爬取并分析全球最美Top100女神榜单的数据

获取到数据后，我们来对数据进行一下清晰，并看一下从数据中能获得什么信息。

1).大洲信息统计

Python爬取并分析全球最美Top100女神榜单的数据

可以看到，全球一百名美女来自了除南极洲之外的其他六个大洲，其中来自亚洲的国家是最多的，欧洲和北美洲紧随其后。

2).国籍信息统计

对于美女国籍的统计和可视化处理，是一件非常麻烦的事情，这里需要针对数据进行耐心的判断处理，虽然非常消耗时间，但是好在数量并不是很多，如下图所示：

Python爬取并分析全球最美Top100女神榜单的数据

可以看到，这一百名美女中，来自美国的是最多的，当然，不可否认的是很多都是持有美国和其他国家的双重国籍身份的。来自英国的是13名美女，当然也是有许多是持有双重国籍的身份。

而第三名的中国和韩国则是完全不存在双重国籍的问题。从全球的分布范围来看，非洲和欧洲的人数直观看上去非常的少，尤其是意大利、法国等一些欧洲国家，都没有如选前100名的美女出现。

3).职业分析

对于榜单中美女们的职业，这里也是非常的集中，只有三种职业：模特、演员、歌手。毫无疑问，每一个职业都是需要自身的条件非常的完美。

Python爬取并分析全球最美Top100女神榜单的数据

上述程序中，通过向FaceScore函数传递图片的路径，在FaceScore函数中，通过get_file_content函数将图片以二进制形式读取；

并通过base64库进行编码后，作为params参数post给请求url链接。并解析url链接返回的信息，提取返回信息中的颜值打分数据；

运行上述的程序后，我们就会得到关于100名美女的AI颜值打分。这里我们为大家展示一下，颜值打分前五名都有哪些明星。

看完上述内容，你们掌握Python爬取并分析全球最美Top100女神榜单的数据的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注亿速云行业资讯频道，感谢各位的阅读！

相关阅读