JavaEye3.0开发手记之三-狮身人面

Sphinx的含义是“狮身人面像”,是古埃及的金字塔建筑,传说Sphinx是有翼的狮身女怪,她常叫过 路行人猜谜, 猜不出者即遭杀害。

但是我这里说的Sphinx是一个高性能的搜索引擎:

http://www.sphinxsearch.com/

Sphinx是一个俄国人开发的搜索引擎,它的主要特点是:

一、性能非常出色

150万条记录一两分钟就索引完毕,2-4GB以内的文本检索速度不到0.1秒钟。ferret也望尘莫及,更不 要说lucene了。

二、和数据库集成性很好

Sphinx通过配置文件可以自行读取数据库信息做索引,不依赖任何外部的应用程序,并且可以作为一 个daemon进程启动,支持分布式检索,并发响应性能很好。因此很多过去使用ferret的人因为并发检索的 问题都改用Sphinx了。

三、可以做MySQL的全文检索

MySQL的数据库引擎是可插拔的结构,Sphinx开发了一个SphinxSE数据库引擎,可以在编译MySQL的时 候直接编译到MySQL里面去,这样的话,可以在数据库级别支持高性能的全文检索,那么你可以以如下SQL 方式去全文检索了:

select * from xxxx where query=’test;sort=attr_asc:group_id’ AND ….;

很棒吧。

四、RoR支持也很棒

有一个acts_as_sphinx插件,类似acts_as_ferret,集成到RoR里面很简单。

Sphinx目前可能存在的问题估计还是中文分词问题:

Sphinx支持UTF-8编码的分词,但是他自己的文档上面说仅仅支持英文和俄文的分词,因此我估计对中 文分词可能还不能很好的支持。

总之,Sphinx是我们另外一个很棒的选择。

一个人的心胸宽阔,可以容不能容的事,可以赢难以赢的人。

JavaEye3.0开发手记之三-狮身人面

相关文章:

你感兴趣的文章:

标签云: