正文

IT精英们:如何判断两个字符串的相似程度?

(2007-01-31 00:09:14) 下一个
我有两个数组A和B,A和B均由数量不等的字符串组成。我需要为A数组中的每个字符串找到在B数组中最相似的一个。

A和B中的字符串有以下特点:
A中的所有字符串符合特定规律: 长度24个字符,前十个字符表示产品型号,接着是2个表示年份,接着6个字符表示序列号。最后六个字符分别由制造厂家、销售区域和填充字符组成。

B中的字符串可能部分符合相同规律,但也可能miss或者多了不定长度的字符。出现差异的字符多数在系列号和最后6个字符处。

有什么好的算法可以匹配A和B中的字符串,让A中的字符串可以找到最近似的B中的字符串来匹配(不一定都能有。因为A和B中的字符串数量可能不同)?

请指教!
[ 打印 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.