要爬取JSON折叠后的所有数据,您可以使用递归的方法来遍历整个JSON对象。 下面是一个示例代码,演示如何使用Python爬取所有的JSON数据。
import json
def crawl_json(data, result):
if isinstance(data, list):
for item in data:
crawl_json(item, result)
elif isinstance(data, dict):
for key, value in data.items():
crawl_json(value, result)
else:
# 处理爬取到的数据
result.append(data)
# 假设您已经从网页上获取到了JSON数据,保存在变量json_data中
json_data = '...' # 请将JSON数据替换为实际的数据
# 解析JSON数据
data = json.loads(json_data)
# 爬取所有数据
result = []
crawl_json(data, result)
# 打印结果
for item in result:
print(item)
在上面的代码中,我们定义了一个crawl_json()
函数,它接受两个参数:JSON数据和结果列表。函数使用递归的方式遍历整个JSON对象,将每个找到的数据添加到结果列表中。最后,我们遍历结果列表并打印出所有的数据。
注意:具体的爬取逻辑可能会根据您的JSON数据结构有所调整,上述代码仅提供一个基本的框架供参考。