发帖

[问答]

什么是爬虫？

1426 爬虫

问答对人有帮助，内容完整，我也想知道答案 0 什么是爬虫？爬虫的价值？最简单的python爬虫爬虫基本架构 0
2020-11-5 06:13:12　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × 陈该类别下有 5 个回答。邀请回答 jf_71236567 该类别下有 3 个回答。邀请回答 HELLOKITTYNEW 该类别下有 2 个回答。邀请回答 dlksmad 该类别下有 2 个回答。邀请回答 mu0543 该类别下有 2 个回答。邀请回答 nvwwerwr 该类别下有 2 个回答。邀请回答 60user28 该类别下有 2 个回答。邀请回答 To7ny 该类别下有 2 个回答。邀请回答 yhsales 该类别下有 2 个回答。邀请回答 puzhang549 该类别下有 2 个回答。邀请回答 ZONEK 该类别下有 2 个回答。邀请回答 tijing忽忽该类别下有 2 个回答。邀请回答 wang22222 该类别下有 1 个回答。邀请回答 038506086 该类别下有 1 个回答。邀请回答 jf_46911124 该类别下有 1 个回答。邀请回答 aero倩该类别下有 1 个回答。邀请回答 rstech_rd 该类别下有 1 个回答。邀请回答 JIWENJIE 该类别下有 1 个回答。邀请回答 hongqiaolian 该类别下有 1 个回答。邀请回答 60user124 该类别下有 1 个回答。邀请回答举报刘佳相关推荐 • 如何运行imdb爬虫？ 2627 • 使用爬虫代理错误问题解决方案 1974 • 请问packet capture爬虫软件抓取的数据怎么做成网页链接？ 3367 • 请问哪位大神可以分享一下scrapy的架构和原理吗？ 14616 • 物联网平台上的数据导出 10848 • 菜鸟求助，如何在labview中实现网页按钮点击操作（按钮只有value及type=submit，无ID，无Name属性） 5161 • 5G与人工智能的关系 4694 • 传感器和人工智能的关系 6128 • 你都知道Python主要应用于哪些领域吗？ 1142 • 什么是Python？看了这篇文章呢就知道了 40670 4个回答

答案对人有帮助，有参考价值 0 什么是爬虫？爬虫的本质就是将互联网网页(数据)下载下来的程序。爬虫通常为PC端爬虫、以及移动端爬虫（接口数据窃取抓包 wap站），当然我们更多的是使用PC端的爬虫。如下图可以看出爬虫相对于人浏览网页的不同，可以在脑袋里有个简单的概念。通过对互联网无数个url数据的下载，url之间可能又有关联，于是形成了犹如蜘蛛网状的结构，而爬虫就守在这张大网之上，因此我们通常又将爬虫成为蜘蛛。

2020-11-5 16:29:51 评论举报徐敏

答案对人有帮助，有参考价值 0 爬虫的价值？列几个简单的例子，看看就行搜索引擎今日头条比价网大数据

2020-11-5 16:29:58 评论举报徐音之

答案对人有帮助，有参考价值 0 最简单的python爬虫 urllib库基于python3.5 # encoding:UTF-8import urllib.requestdef download_data(): url = "http://www.baidu.com" response = urllib.request.urlopen(url) print(response.getcode()) if response.getcode() == 200: print(response.read())download_data() 运行结果如下可以看出爬虫下载都是网页源码。

2020-11-5 16:30:05 评论举报刘龙飞

答案对人有帮助，有参考价值 0 爬虫基本架构由上图可以看出爬虫一般由爬虫调度器、URL管理器、网页下载器、网页解析器、数据存储这几个模块组成。爬虫调度器主要是对url管理器、网页下载器网页解析器进行管理。 URL管理器主要通过初始url及网页解析器获得的url进行存储管理，并为调度器提供接口，为网页下载器提供下载入口。网页下载器主要功能就是下载该url下的网页数据(源码) 网页解析器一方面解析出我们需要的价值数据，一方面又将网页下载器下载数据中的url存储到url管理器中。数据存储是将网页解析器的解析的价值数据存储到内存、数据库、文件等。

2020-11-5 16:30:14 评论举报姜钰

撰写答案

你正在撰写答案

如果你是对答案或其他答案精选点评或询问，请使用“评论”功能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容图片侵权或者其他问题，请联系本站作侵删。侵权投诉

我要提问

精选推荐

一文了解Mojo编程语言

2399 浏览 0 评论
Arduino Uno l两轮自平衡机器人电机驱动无输出求解

4395 浏览 3 评论
TT电机，Arduino Uno,L298N 5AD ,MPU6050最简自平衡机器人资料

1487 浏览 0 评论
机械臂眼在手上精度一直下不来怎么办？

4482 浏览 0 评论
AI的未来，属于那些既能写代码，又能焊电路的“双栖人才”

5482 浏览 0 评论

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

返回机器人论坛

回复

关闭

站长推荐 /9

快速回复 返回顶部 返回列表

- 厂商专区: 飞凌嵌入式

瑞萨单片机论坛

米尔电子

Aigtek安泰电子

斯丹麦德电子

芯佰微电子

其利天下技术小组

道生物联技术社区

视美泰

FCom富士晶振

合众恒跃

进迭时空

RT-Thread论坛

EASY-EAI灵眸科技

- 技术社区: 张飞电子技术社区

KaihongOS技术社区

FPGA开发者技术社区

RISC-V MCU技术社区

HarmonyOS技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

+ 元器件搜索引擎: 元器件搜索引擎

time

recommend

hot

post

—
—
—

版
块
导
航