导航菜单
路很长,又很短
博主信息
昵   称:Cocodroid ->关于我
Q     Q:2531075716
博文数:346
阅读量:1546529
访问量:182861
至今:
×
分享博文列表:【Solr
· Python爬虫入门八之Beautiful Soup的用法
    上一节我们介绍了正则表达式,它的内容其实还是蛮多的,如果一个正则匹配稍有差池,那可能程序就处在永久的循环之中,而且有的小伙伴们也对写正则表达式的写法用得不熟练,没关系,我们还有一个更强大的工具,叫BeautifulSoup,有了它我们可以很方便地提取出HTML或XML标签中的内容 ...更多
(946)阅读 2016-02-14

· Solr4.8.0源码分析(24)之SolrCloud的Re
    题记:关于SolrCloud的Recovery策略已经写了四篇了,这篇应该是系统介绍Recovery策略的最后一篇了。本文主要介绍Solr的主从同步复制。它与前文<Solr4.8.0源码分析(22)之SolrCloud的Recovery策略(三)>略有不同,前文讲到的 ...更多
(891)阅读 2016-02-12

· Solr4.8.0源码分析(23)之SolrCloud的Re
    题记:本来计划的SolrCloud的Recovery策略的文章是3篇的,但是没想到Recovery的内容蛮多的,前面三章分别介绍了Recovery的原理和总体流程,PeerSync策略,Replication策略。本章主要介绍我在实际生产环境中碰到的recovery的几个问题,以 ...更多
(940)阅读 2016-02-12

· Solr4.8.0源码分析(22)之SolrCloud的Re
    本文是SolrCloud的Recovery策略系列的第三篇文章,前面两篇主要介绍了Recovery的总体流程,以及PeerSync策略。本文以及后续的文章将重点介绍Replication策略。Replication策略不但可以在SolrCloud中起到leader到replica ...更多
(1087)阅读 2016-02-02

· Solr4.8.0源码分析(21)之SolrCloud的Re
    题记:前文<Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一)>中提到Recovery有两种策略,一是PeerSync和Replication。本节将具体介绍下PeerSync策略。PeeySync是Solr的优先选择策略,每当需要进行 ...更多
(881)阅读 2016-02-01

· Solr4.8.0源码分析(20)之SolrCloud的Re
    题记:我们在使用SolrCloud中会经常发现会有备份的shard出现状态Recoverying,这就表明SolrCloud的数据存在着不一致性,需要进行Recovery,这个时候的SolrCloud建索引是不会写入索引文件中的(每个shard接受到update后写入自己的ulo ...更多
(1176)阅读 2016-01-31

· Solr4.8.0源码分析(19)之缓存机制(二)
    前文<Solr4.8.0源码分析(18)之缓存机制(一)>介绍了Solr缓存的生命周期,重点介绍了Solr缓存的warn过程。本节将更深入的来介绍下Solr的四种缓存类型,以及两种SolrCache接口实现类。1、SolrCache接口实现类前文已经提到SolrCac ...更多
(977)阅读 2016-01-30

· Solr4.8.0源码分析(18)之缓存机制(一)
    前文在介绍commit的时候具体介绍了getSearcher()的实现,并提到了Solr的预热warn。那么本文开始将详细来学习下Solr的缓存机制。1.简介Solr目前支持4中cache类型,每种缓存对应一种查询类型。filterCachedocumentCachefieldv ...更多
(1105)阅读 2016-01-28

· Solr4.8.0源码分析(17)之SolrCloud索引深
    前面几节以add为例已经介绍了solrcloud索引链建索引的三步过程,delete以及deletebyquery跟add过程大同小异,这里暂时就不介绍了。由于commit流程较为特殊,那么本节主要简要介绍下commit的流程。1.SolrCloud的commit流程SolrCl ...更多
(800)阅读 2016-01-27

· Solr4.8.0源码分析(16)之SolrCloud索引深
    前面两节学习了SolrCloud索引过程以及索引链的前两步,LogUpdateProcessorFactory和DistributedUpdateProcessor。本节将详细介绍了索引链的第三步DirectUpdateHandler2和UpdateLog。1.DirectUpd ...更多
(903)阅读 2016-01-25

· Solr4.8.0源码分析(15) 之 SolrCloud索
    上一节主要介绍了SolrCloud分布式索引的整体流程图以及索引链的实现,那么本节开始将分别介绍三个索引过程即LogUpdateProcessor,DistributedUpdateProcessor,DirectUpdateHandler2。本节主要研究下LogUpdatePr ...更多
(842)阅读 2016-01-23

· Solr4.8.0源码分析(14) 之 SolrCloud索
    1.SolrCloud的索引过程流程图这里借用下《solrCloudUpdateRequestHandling更新索引流程》流程图:由上图可以看出,SolrCloud的索引过程主要通过一个索引链过程来实现的,那么本节主要讲述下索引链以及DistributedUpdateProce ...更多
(830)阅读 2016-01-21

· Solr4.8.0源码分析(13)之LuceneCore的索
    题记:今天在公司研究elasticsearch,突然看到一篇博客说elasticsearch具有索引修复功能,顿感好奇,于是点进去看了下,发现原来是LuceneCore自带的功能。说实话之前学习Lucene文件格式的时候就想做一个索引文件解析和检测的工具,也动手写了一部分,最后没 ...更多
(1255)阅读 2016-01-19

· Solr4.8.0源码分析(12)之Lucene的索引文件(
    1.存储域数据文件(.fdt和.fdx)Solr4.8.0里面使用的fdt和fdx的格式是lucene4.1的。为了提升压缩比,StoredFieldsFormat以16KB为单位对文档进行压缩,使用的压缩算法是LZ4,由于它更着眼于速度而不是压缩比,所以它能快速压缩以及解压。1 ...更多
(893)阅读 2016-01-16

· Solr4.8.0源码分析(11)之Lucene的索引文件(
    1..dvd和.dvm文件.dvm是存放了DocValue域的元数据,比如DocValue偏移量。.dvd则存放了DocValue的数据。在Solr4.8.0中,dvd以及dvm用到的Lucene编码格式是Lucene45DocValuesFormat。跟之前的文件格式类似,它分 ...更多
(1086)阅读 2016-01-15

· Solr4.8.0源码分析(10)之Lucene的索引文件(
    1..si文件  .si文件存储了段的元数据,主要涉及SegmentInfoFormat.java和Segmentinfo.java这两个文件。由于本文介绍的Solr4.8.0,所以对应的是SegmentInfoFormat的子类Lucene46SegmentInfoFormat ...更多
(1071)阅读 2016-01-13

· Solr4.8.0源码分析(9)之Lucene的索引文件(2
    一.Segments_N文件  一个索引对应一个目录,索引文件都存放在目录里面。Solr的索引文件存放在Solr/Home下的core/data/index目录中,一个core对应一个索引。Segments_N例举了索引所有有效的segments信息以及删除的具体信息,一个索引可 ...更多
(997)阅读 2016-01-11

· Solr4.8.0源码分析(8)之Lucene的索引文件(1
    题记:最近有幸看到觉先大神的Lucene的博客,感觉自己之前学习的以及工作的太为肤浅,所以决定先跟随觉先大神的博客学习下Lucene的原理。由于觉先大神主要介绍的是Lucene3.X系的,那我就根据源码以及结合觉先大神的来学习下4.X系的。内容可能会有些变化,且加入下我个人的理解 ...更多
(881)阅读 2016-01-10

· Solr4.8.0源码分析(7)之Solr SPI
    查看Solr源码时候会发现,每一个package都会由对应的resources.如下图所示:一时对这玩意好奇了,看了文档以后才发现,这个services就是javaSPI机制。首先介绍下javaSPI机制,然后再结合Solr谈一下SPI。1.JAVASPI当服务的提供者,提供了服 ...更多
(1065)阅读 2016-01-08

· Solr4.8.0源码分析(6)之非排序查询
    上篇文章简单介绍了Solr的查询流程,本文开始将详细介绍下查询的细节。查询主要分为排序查询和非排序查询,由于两者走的是两个分支,所以本文先介绍下非排序的查询。查询的流程主要在SolrIndexSearch.getDocListC(QueryResultqr,QueryComman ...更多
(852)阅读 2016-01-06