Python爬取网络图片保存到本地文件夹

Python爬取网络图片保存到本地文件夹主要内容第一步引入库文件第二步获取网页文档第三步获取图片地址第四步通过地址保存图片在main方法执行以上方法执行main()方法爬取结果主要内容经过上一次的爬虫实例，我已经认识到了网络爬虫的基本步骤，这一次再次做了一套练习，爬取网页图片并且保存到本地。其基本步骤就是获取网页文档，查找目标img标签，再获取img标签的src值然后对图片进行保存~~，上

GIS码农

13697人浏览 · 2020-08-13 00:02:10

GIS码农 · 2020-08-13 00:02:10 发布

Python爬取网络图片保存到本地文件夹

主要内容

经过上一次的爬虫实例，我已经认识到了网络爬虫的基本步骤，这一次再次做了一套练习，爬取网页图片并且保存到本地。其基本步骤就是获取网页文档，查找目标img标签，再获取img标签的src值然后对图片进行保存~~，上次分析了怎么获取标签，这次就不再重复了。

第一步引入库文件

import requests
import bs4
from bs4 import BeautifulSoup
import os

第二步获取网页文档

def getHtml(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("连接出错了~~")

第三步获取图片地址

循环图片的容器，将src值提取出来保存在列表里面。

def getImg(text):
    urlList = []
    soup = BeautifulSoup(text,"html.parser")
    tag = soup.find("ul",class_="ali")
    for item in tag.children:
        if isinstance(item, bs4.element.Tag):
            img = item.find("img")
            src = img.get('src')
            print("获取到图片地址："+src)
            urlList.append(src)
    return urlList

第四步通过地址保存图片

为了更加直观看到图片被保存，将网络图片的图片名作为我们保存的图片命名，因为获取的src值链接没有“http:”这里把它拼接上，不然要报错呀~~

def getImgFile(root,text):
    for url in getImg(text):
        picName = url.split('/')[-1]
        path = root + picName
        try:
            if not os.path.exists(root):
                os.mkdir(root)
            if not os.path.exists(path):
                r = requests.get("http:" + url)
                with open(path, "wb") as f:
                    f.write(r.content)
                    f.close()
                    print(picName + "已经保存成功！")
            else:
                print(picName + "已存在！")
        except:
            print("爬取失败！")

第五步在main方法执行以上方法

def main():
    text = getHtml("https://www.ivsky.com/tupian/ziranfengguang/")
    root = "D://picture//"
    getImgFile(root,text)

第六步执行main()方法

main()

在这里插入图片描述

爬取结果

以下就是爬取结果了~~噢咦，感兴趣的快体验一把吧！！！
在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

数据结构与算法 - 多维度DP：二维状态下的转移方程设计

2048 AI社区

基于SpringBoot+Vue的房屋租赁系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】

2048 AI社区

Java SpringBoot+Vue3+MyBatis “共享书角”图书借还管理系统系统源码｜前后端分离+MySQL数据库

2048 AI社区

所有评论(0)

查看更多评论

GIS码农

@qq_43066675

已为社区贡献1条内容

Python爬取网络图片保存到本地文件夹

GIS码农

Python爬取网络图片保存到本地文件夹

主要内容

第一步 引入库文件

第二步 获取网页文档

第三步 获取图片地址

第四步 通过地址保存图片

第五步 在main方法执行以上方法

第六步 执行main()方法

爬取结果

所有评论(0)

GIS码农

第一步引入库文件

第二步获取网页文档

第三步获取图片地址

第四步通过地址保存图片

第五步在main方法执行以上方法

第六步执行main()方法