导航菜单
路很长,又很短
博主信息
昵   称:Cocodroid ->关于我
Q     Q:2531075716
博文数:297
阅读量:606231
访问量:56576
至今:
×
博文->>搜索结果(耗时0.052秒) 博文列表>>
Tags : Python,爬虫 发表时间: 2015-12-18 21:09:24
大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。Python版本:2.7,Python3请另寻其他博文。首先爬虫是什么?网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐...
类别:爬虫 | 阅读(519)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,Beautiful Soup 发表时间: 2015-12-23 19:57:56
来说,BeautifulSoup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:BeautifulSoup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能lxml、html6lib一样出色的python解释器,为用户灵活地提供不同的解析策略或强劲的速度。废话不多说,我们来试一下吧~2.Beauti...
类别:爬虫 | 阅读(448)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,Cookie 发表时间: 2015-12-21 19:01:03
现在可以顺利获取网站信息了,接下来就是把网站里面有效内容提取出来,下一节我们去会会正则表达式!转载:静觅»Python爬虫入门六之Cookie的使用...
类别:爬虫 | 阅读(437)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,URLError异常处理 发表时间: 2015-12-20 23:22:52
"):printe.reasonelse:print"OK"首先对异常的属性进行判断,以免出现属性输出报错的现象。以上,就是对URLError和HTTPError的相关介绍,以及相应的错误处理办法,小伙伴们加油!转载:静觅»Python爬虫入门五之URLError异常处理...
类别:爬虫 | 阅读(423)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,正则表达式 发表时间: 2015-12-22 18:21:38
中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。正则表达式的大致匹配过程是:1.依次拿出表达式和文本中的字符比较,2.如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。3.如果表达式中有量词或边界,这个过程会稍微有一些不同。2.正则表达式的语法规则下面是Python中正则表达式的一些匹配规则,图片资料来自CSDN3.正则表达式相...
类别:爬虫 | 阅读(575)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,Urllib库 发表时间: 2015-12-20 12:37:14
)urllib2.install_opener(opener)response=urllib2.urlopen('http://www.baidu.com')以上便是一部分高级特性,前三个是重要内容,在后面,还有cookies的设置还有异常的处理,小伙伴们加油!转载:静觅»Python爬虫入门四之Urllib库的高级用法...
类别:爬虫 | 阅读(395)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫 发表时间: 2015-12-19 12:45:00
,准确理解它的含义对爬虫学习有很大帮助。4.环境的配置学习Python,当然少不了环境的配置,最初我用的是Notepad++,不过发现它的提示功能实在是太弱了,于是,在Windows下我用了PyCharm,在Linux下我用了EclipseforPython,另外还有几款比较优秀的IDE,大家可以参考这篇文章学习Python推荐的IDE。好的开发工具是前进的推进器,希望大家可以找到适合自己的IDE下一节,我们就正式步入...
类别:爬虫 | 阅读(474)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,Urllib库 发表时间: 2015-12-19 22:46:08
就实现了数据的GET方式传送。本节讲解了一些基本使用,可以抓取到一些基本的网页信息,小伙伴们加油!转载:静觅»Python爬虫入门三之Urllib库的基本使用...
类别:爬虫 | 阅读(479)| 回复(0)| (0) 阅读全文>>
Tags : Python,爬虫,Scrapy 发表时间: 2015-12-26 14:02:37
是Win7,首先,你要有Python,我用的是2.7.7版本,Python3相仿,只是一些源文件不同。官网文档:http://doc.scrapy.org/en/latest/intro/install.html,最权威哒,下面是我的亲身体验过程。1.安装Python安装过程我就不多说啦,我的电脑中已经安装了...
类别:爬虫 | 阅读(583)| 回复(0)| (0) 阅读全文>>
Tags : 大数据,推荐系统,Python 发表时间: 2015-04-18 12:56:25
原型,咱采用Python代码来演示。1.推荐系统的第一步,需要想办法收集信息不同的业务,不同的推荐系统需要收集的信息不一样针对咱要做的电影推荐,自然是每个用户对自己看过的电影的评价了,如下图所示...
类别:大数据 | 阅读(537)| 回复(0)| (0) 阅读全文>>