在VSCode中使用Python进行爬虫开发时,异常捕获是非常重要的。你可以使用try-except语句来捕获和处理异常。以下是一个简单的示例:
首先,确保你已经安装了VSCode的Python扩展。如果没有,请访问Python扩展页面进行安装。
创建一个新的Python文件,例如spider.py
,并在其中编写以下代码:
import requests
from bs4 import BeautifulSoup
def get_html(url):
try:
response = requests.get(url)
response.raise_for_status()
return response.text
except requests.exceptions.RequestException as e:
print(f"请求异常: {e}")
return None
def parse_html(html):
try:
soup = BeautifulSoup(html, "html.parser")
# 在这里编写你的解析逻辑
return soup
except Exception as e:
print(f"解析异常: {e}")
return None
def main():
url = "https://example.com"
html = get_html(url)
if html:
soup = parse_html(html)
if soup:
# 在这里编写你的处理逻辑
pass
if __name__ == "__main__":
main()
在这个示例中,我们使用了requests
库来发送HTTP请求,并使用BeautifulSoup
库来解析HTML内容。我们使用try-except语句捕获了可能发生的异常,并在控制台输出异常信息。
当你运行这个爬虫时,如果在请求或解析过程中发生异常,程序将捕获异常并输出错误信息,而不会崩溃。你可以根据实际需求修改这个示例,以实现自己的爬虫功能。