在Pandas中处理HTML数据,可以使用pd.read_html()
函数来将HTML表格数据读取为DataFrame对象。这个函数将返回一个包含所有表格数据的列表,每个表格数据对应一个DataFrame对象。
以下是一个简单的示例:
import pandas as pd
# 读取网页中的表格数据
url = 'https://en.wikipedia.org/wiki/List_of_countries_by_past_and_future_population'
tables = pd.read_html(url)
# 打印第一个表格数据
print(tables[0])
这样就可以将网页中的表格数据读取为DataFrame对象,然后可以对数据进行进一步处理和分析。