随着企业网站各功能模块中信息量的逐渐增加, 如何利用关键词快速地查找到所需信息也就成了网站要解决的关键问题之一。对于小型的企业网站来说, 由于数据量不是太大, 采用基于数据库的模糊检索方式就能满足要求。但这种检索方式只适合检索结构化数据, 无法对文本、图片等非结构化数据进行检索。而且, 在使用like查询时, 需要对数据库表格中相关字段的内容全部检索一次, 在数据量较大的环境下, like查询对系统性能的影响是相当大的。
       为解决传统数据检索方式存在的效率低下问题, 以Lucene为代表的站内全文检索技术也就应运而生。Lucene的检索过程实际上就是把模糊查询变成可以利用索引进行精确查询的过程, 就如查字典, 只需要从索引目录中找出所查字符的页码即可实现精确定位, 不需要一页一页的去搜寻, 极大地提升了数据检索的效率和准确性。全文检索的实现过程主要分为索引创建和搜索索引两个步骤。其中, 索引创建就是将结构化数据和非结构化数据的特征信息提取出来并储存到创建好的索引库中;搜索索引就是根据用户需要查询的关键词, 从索引库中搜索出满足条件的记录, 然后将查询结果返回给用户。