public class TextSimilarity extends Object
Constructor and Description |
---|
TextSimilarity() |
Modifier and Type | Method and Description |
---|---|
static String |
longestCommonSubstring(String strA,
String strB)
最长公共子串,采用动态规划算法。 其不要求所求得的字符在所给的字符串中是连续的。
算法解析见:https://leetcode-cn.com/problems/longest-common-subsequence/solution/zui-chang-gong-gong-zi-xu-lie-by-leetcod-y7u0/ |
static double |
similar(String strA,
String strB)
利用莱文斯坦距离(Levenshtein distance)算法计算相似度,两个都是空串相似度为1,被认为是相同的串
比较方法为: 只比较两个字符串字母、数字、汉字部分,其他符号去除 计算出两个字符串最大子串,除以最长的字符串,结果即为相似度 |
static String |
similar(String strA,
String strB,
int scale)
利用莱文斯坦距离(Levenshtein distance)算法计算相似度百分比
|
public static double similar(String strA, String strB)
strA
- 字符串1strB
- 字符串2public static String similar(String strA, String strB, int scale)
strA
- 字符串1strB
- 字符串2scale
- 保留小数public static String longestCommonSubstring(String strA, String strB)
strA
- 字符串1strB
- 字符串2Copyright © 2024. All rights reserved.