public class TextPreprocess extends Object
Modifier and Type | Method and Description |
---|---|
static String |
delKeyword(String target,
String rules)
该方法删除一字符串中所有匹配某一规则字串
可用于清理一个字符串中的空白符和语气助词
|
static String |
numberTranslator(String target)
该方法可以将字符串中所有的用汉字表示的数字转化为用阿拉伯数字表示的数字
如"这里有一千两百个人,六百零五个来自中国"可以转化为
"这里有1200个人,605个来自中国"
此外添加支持了部分不规则表达方法
如两万零六百五可转化为20650
两百一十四和两百十四都可以转化为214
一六零加一五八可以转化为160+158
该方法目前支持的正确转化范围是0-99999999
该功能模块具有良好的复用性
|
static String |
preprocess(String text)
文本预处理
|
public static String preprocess(String text)
text
- 待处理文本public static String delKeyword(String target, String rules)
target
- 待处理字符串rules
- 删除规则public static String numberTranslator(String target)
target
- 待转化的字符串Copyright © 2021. All rights reserved.