千家信息网

Python如何实现简单网页图片

发表于:2025-11-07 作者:千家信息网编辑
千家信息网最后更新 2025年11月07日,今天就跟大家聊聊有关Python如何实现简单网页图片,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Python实现简单网页图片抓取完整代码实例
千家信息网最后更新 2025年11月07日Python如何实现简单网页图片

今天就跟大家聊聊有关Python如何实现简单网页图片,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

  Python实现简单网页图片抓取完整代码实例

  分类专栏: python

  文章标签: 编程语言 python java 大数据

  版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

  本文链接:https://blog.csdn.net/chengxun03/article/details/106321564

  收起

  @本文来源于公众号:csdn2299,喜欢可以关注公众号 程序员学府

  这篇文章主要介绍了Python实现简单网页图片抓取完整代码实例,具有一定借鉴价值,需要的朋友可以参考下。

  利用python抓取网络图片的步骤是:

  1、根据给定的网址获取网页源代码

  2、利用正则表达式把源代码中的图片地址过滤出来

  3、根据过滤出来的图片地址下载网络图片

  以下是比较简单的一个抓取某一个百度贴吧网页的图片的实现:

  # -*- coding: utf-8 -*-

  # feimengjuan

  import re

  import urllib

  import urllib2

  #抓取网页图片

  #根据给定的网址来获取网页详细信息,得到的html就是网页的源代码

  def getHtml(url):

  page = urllib.urlopen(url)

  html = page.read()

  return html

  def getImg(html):

  #利用正则表达式把源代码中的图片地址过滤出来

  reg = r'src="(.+?\.jpg)" pic_ext'

  imgre = re.compile(reg)

  imglist = imgre.findall(html) #表示在整个网页中过滤出所有图片的地址,放在imglist中

  x = 0

  for imgurl in imglist:

  urllib.urlretrieve(imgurl,'%s.jpg' %x) #打开imglist中保存的图片网址,并下载图片保存在本地

  x = x + 1

  html = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息,得到的html就是网页的源代码

  getImg(html)#从网页源代码中分析并下载保存图片

  进一步对代码进行了整理,在本地创建了一个"图片"文件夹来保存图片

  # -*- coding: utf-8 -*-

  # feimengjuan

  import re

  import urllib

  import urllib2

  import os

  #抓取网页图片

  #根据给定的网址来获取网页详细信息,得到的html就是网页的源代码

  def getHtml(url):

  page = urllib.urlopen(url)

  html = page.read()

  return html

  #创建保存图片的文件夹

  def mkdir(path):

  path = path.strip()

  # 判断路径是否存在

  # 存在 True

  # 不存在 Flase

  isExists = os.path.exists(path)

  if not isExists:

  print u'新建了名字叫做',path,u'的文件夹'

  # 创建目录操作函数

  os.makedirs(path)

  return True

  else:

  # 如果目录存在则不创建,并提示目录已经存在

  print u'名为',path,u'的文件夹已经创建成功'

  return False

  # 输入文件名,保存多张图片

  def saveImages(imglist,name):

  number = 1

  for imageURL in imglist:

  splitPath = imageURL.split('.')

  fTail = splitPath.pop()

  if len(fTail) > 3:

  fTail = 'jpg'

  fileName = name + "/" + str(number) + "." + fTail

  # 对于每张图片地址,进行保存

  try:

  u = urllib2.urlopen(imageURL)

  data = u.read()

  f = open(fileName,'wb+')

  f.write(data)

  print u'正在保存的一张图片为',fileName

  f.close()

  except urllib2.URLError as e:

  print (e.reason)

  number += 1

  #获取网页中所有图片的地址

  def getAllImg(html):

  #利用正则表达式把源代码中的图片地址过滤出来

  reg = r'src="(.+?\.jpg)" pic_ext'

  imgre = re.compile(reg)

  imglist = imgre.findall(html) #表示在整个网页中过滤出所有图片的地址,放在imglist中

  return imglist

  #创建本地保存文件夹,并下载保存图片

  if __name__ == '__main__':

  html = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息,得到的html就是网页的源代码

  path = u'图片'

  mkdir(path) #创建本地文件夹

  imglist = getAllImg(html) #获取图片的地址列表

  saveImages(imglist,path) # 保存图片

  结果在"图片"文件夹下保存了几十张图片,如截图:

看完上述内容,你们对Python如何实现简单网页图片有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。

图片 网页 地址 源代码 文件 文件夹 网址 简单网页 信息 就是 代码 内容 正则 目录 表达式 公众 实例 文章 版权 篇文章 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 盈克网络技术推广 通信与网络技术领域的应用 网络安全管理考试难度 新浪云服务器地址 查询金融信息基础数据库 视频服务器ir指示灯什么意思 正确使网用网拒做网络安全俘虏 海南快乐旅程网络技术有限公司 广东南粤银行 网络安全 健康体检软件开发合同 系统软件与服务器的通信 鄂尔多斯市委网络安全督查 sql数据库mdf 面试软件开发公司 网络安全管理课程教学大纲 网络安全等级测评师能挂靠吗 可以搭建服务器的单机游戏 梦幻转区后转回原服务器 网络安全小学生朗诵 黑色沙漠各个服务器如何区分 北京昌平区网络技术培训 达梦数据库管理工具初始化错误 安卓扫描读取二维码写入数据库 添加和删除服务器角色成员 无线传感器网络技术概述 中国名家数据库廉丛林 我的世界服务器排面 论文写作中数据库的使用 我的世界外国的服务器 网络安全与技术
0