Solr4.0(SolrCloud) & ElasticSearch(ES) 比较(一)

Team之前的search解决方案不同于行业常见架构(solr及其它开源项目),其searcher和indexer在分布式环境下是分离的,而solr等open source project 基本都是放在单个instance的。两者以单独的instance 存在,甚至可以searcher部署在A机器上,indexer部署在B机器上。当然我们也支持将两者放在同一个instance里。这种架构足以满足之前的需求,并且运行良好。
阅读全文

Lucene Payload 的研究与应用

Lucene 是最初是由 Douglass R. Cutting 博士发布在自己主页上的一个 Java 全文信息检索工具包,后来成为 Apache Jakarta 家族中的一个开源项目,目前已经成为 Apache 基金会的顶级项目。索引是现代搜索引擎的核心,建立索引的过程就是把源数据处理成方便查询的索引文件的过程。 Lucene 采用的是一种被称为倒排索引 (Inverted Index) 的机制,倒排索引也是大多现代搜索引擎的基础。
阅读全文

SolrCloud使用教程、原理介绍

SolrCloud 是基于 Solr 和 Zookeeper 的分布式搜索方案,是正在开发中的 Solr4.0 的核心组件之一,它的主要思想是使用 Zookeeper 作为集群的配置信息中心。
它有几个特色功能:①集中式的配置信息 ②自动容错 ③近实时搜索 ④查询时自动负载均衡。
阅读全文

Solr自定义修改评分公式的得分

Lucene的打分公式非常复杂,如下: lucene评分公式 公司希望搜索的结果排序可以精细化,实现某些搜索的内容需要排在某些前面。 大家都知道通过lucene 提供的 Similarity可以实现影响公式的最后得分,分数决定了排序,但貌似解决不了这个问题。
阅读全文

Solr 开发过程中遇到的一下资料、问题整理(资料)

1.用Solr开发了公司的搜索引擎一段时间,发现目前 中文版 的资料很少,整理了下找到的初学入门相关资料,希望能对后续学习者有所帮助。
Solr in Action 英文版,提取密码:17wl
Apache Solr 3.1 Cookbook.pdf ,提取密码:es11
Apache Solr 4 Cookbook.pdf,提取密码:7btf
ApacheSolrRefGuide,提取密码:5wco
solr参数说明,提取密码:654l
阅读全文

Solr 对比 Lucene 的优势

在Solr的官方网站上找打了一个Solr和Lucene比较的文章,希望对正在搜索引擎选型的同学有所帮助。
1、Solr的特性
● 先进的全文本搜索能力;
● 对高性能web应用的优化;
● 以开放协议(XML、JSON、HTTP)为接口;
● 拥有完整的HTML管理端;
阅读全文