如何用python在网页中提取图片

想要在网页中提取图片，Python提供了多种工具和库可以帮助我们实现这一目标，下面，我将详细介绍如何使用Python来从网页中抓取图片，让你能够轻松地将网上的图片保存到本地。

我们需要了解，网页中的图片通常是以<img>标签的形式存在的，这些标签中包含了图片的URL，我们的目标就是找到这些标签，并提取出图片的链接，然后下载图片，为了完成这个任务，我们可以使用requests库来发送网络请求，以及BeautifulSoup库来解析HTML文档。

准备工作

在开始之前，确保你已经安装了requests和BeautifulSoup库，如果没有安装，可以通过以下命令安装：

pip install requests beautifulsoup4

使用requests库，我们可以向目标网站发送HTTP请求，并获取网页的HTML内容，以下是如何发送请求的示例代码：

import requests
url = '你想要抓取图片的网页地址'
response = requests.get(url)
确保请求成功
if response.status_code == 200:
    html_content = response.text
else:
    print("请求失败，状态码：", response.status_code)

步骤二：解析HTML文档提取图片链接

获取到网页的HTML内容后，我们可以使用BeautifulSoup来解析这些内容，并提取出<img>标签中的图片链接，以下是如何解析HTML并提取图片链接的示例代码：

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_content, 'html.parser')
images = soup.find_all('img')
存储图片链接的列表
image_urls = []
for image in images:
    image_url = image.get('src')
    if image_url:
        image_urls.append(image_url)

步骤三：下载图片

现在我们已经得到了图片的链接，接下来就是下载这些图片了，我们可以使用requests库来下载图片，并保存到本地，以下是如何下载并保存图片的示例代码：

import os
创建一个文件夹来保存图片
if not os.path.exists('downloaded_images'):
    os.makedirs('downloaded_images')
下载并保存图片
for i, image_url in enumerate(image_urls):
    try:
        response = requests.get(image_url)
        if response.status_code == 200:
            # 保存图片到本地
            with open(f'downloaded_images/image_{i+1}.jpg', 'wb') as f:
                f.write(response.content)
            print(f"图片 {i+1} 下载成功")
    except Exception as e:
        print(f"下载图片 {i+1} 时发生错误: {e}")