Package | Description |
---|---|
cn.hutool.dfa |
DFA全称为:Deterministic Finite Automaton,即确定有穷自动机。
解释起来原理其实也不难,就是用所有关键字构造一棵树,然后用正文遍历这棵树,遍历到叶子节点即表示文章中存在这个关键字。 我们暂且忽略构建关键词树的时间,每次查找正文只需要O(n)复杂度就可以搞定。 |
Class and Description |
---|
FoundWord
匹配到的单词,包含单词,text中匹配单词的内容,以及匹配内容在text中的下标,
下标可以用来做单词的进一步处理,如果替换成**
|
SensitiveProcessor |
WordTree
DFA(Deterministic Finite Automaton 确定有穷自动机)
DFA单词树(以下简称单词树),常用于在某大段文字中快速查找某几个关键词是否存在。
单词树使用group区分不同的关键字集合,不同的分组可以共享树枝,避免重复建树。 单词树使用树状结构表示一组单词。 例如:红领巾,红河构建树后为: 红 / \ 领 河 / 巾 其中每个节点都是一个WordTree对象,查找时从上向下查找。 |
Copyright © 2021. All rights reserved.