IT精英们:如何判断两个字符串的相似程度?
(2007-01-31 00:09:14)
下一个
我有两个数组A和B,A和B均由数量不等的字符串组成。我需要为A数组中的每个字符串找到在B数组中最相似的一个。
A和B中的字符串有以下特点:
A中的所有字符串符合特定规律: 长度24个字符,前十个字符表示产品型号,接着是2个表示年份,接着6个字符表示序列号。最后六个字符分别由制造厂家、销售区域和填充字符组成。
B中的字符串可能部分符合相同规律,但也可能miss或者多了不定长度的字符。出现差异的字符多数在系列号和最后6个字符处。
有什么好的算法可以匹配A和B中的字符串,让A中的字符串可以找到最近似的B中的字符串来匹配(不一定都能有。因为A和B中的字符串数量可能不同)?
请指教!