Tantivy全文搜索引擎库
Tantivy 是一个用 Rust 编写的搜索引擎库,其灵感来自于 Lucene。
得益于 Rust 语言加持,Tantivy 性能比 Lucene 要好得多
主要特性:
- 全文搜索
- 可配置的分词器,支持 17 种语言词干,包括中文、日文和韩文
- 速度非常快(check out the 🐎 ✨ benchmark ✨ 🐎)
- 启动时间极短 (<10ms), perfect for command-line tools
- BM25 评分 (与 Lucene 相同)
- 自然查询语言 (e.g.
(michael AND jackson) OR "king of pop"
) - 短语查询搜索 (e.g.
"michael jackson"
) - 增量索引
- 多线程索引
- Mmap 目录
- SIMD 整数压缩,支持 SSE2 指令集
- 快速的单值和多值 u64, i64, f64 字段 (等同于 lucene 中的 doc values)
-
&[u8]
fast fields - Text, i64, u64, f64, dates, and hierarchical facet fields
- LZ4 压缩文档存储
- 范围搜索
- Faceted 搜索
- 可配置的索引
- JSON 字段
- 聚合收集器,包括 range buckets, average, and stats metrics
- LogMergePolicy with deletes
- Searcher Warmer API
- Cheesy logo with a horse
评论
Tantivy全文搜索引擎库
Tantivy是一个用Rust编写的搜索引擎库,其灵感来自于Lucene。得益于Rust语言加持,Tantivy性能比Lucene要好得多主要特性:全文搜索可配置的分词器,支持17种语言词干,包括中文
Tantivy全文搜索引擎库
0
TantinyRuby 全文搜索引擎库
Tantiny是一个基于Tantivy的Ruby的最小化全文搜索库。当你手头的任务需要全文搜索,但配置一个完整的分布式搜索引擎会比任务本身花费更多的时间时,它是非常好的选择。即使你已经在你的项目中使用
TantinyRuby 全文搜索引擎库
0