Excel EFunction函数插件模糊匹配函数上新了,新推出个ETSimilarity注意事项:模糊匹配效率相对较低,如果数据体量比较大,在创建模糊匹配数据集时,请耐心等待。数据集创建成功后,就可以使用查找函数快速查找出来近似数据了。第二个参数:nGram,分词窗口宽度,该参数默认为2,表示按2个字符进行切分。例如案例:=ETSimilaritySet(A2:A42,6)数据集创建成功后,函数会返回ETSimilaritySetM:3。需要注意创建数据集比较耗时。第二步:数据集创建成功后,就可以使用配对函数ETSimilaritySetSearch函数进行模糊匹配了。该函数有三个参数:第二个参数:Search,该参数为待模糊匹配查找数据第三个参数:topN,提取前几条记录,默认为1条记录例如案例:=ETSimilaritySetSearch($B$1,A2,1)。函数返回了数据集之中最接近的结果。ETSimilaritySet该函数需要手动指定切分宽度,如果想一次指定多个切分宽度可以使用ETSimilaritySetM函数。函数用法基本类似:
第一个参数:Data待创建的模糊匹配数据集
第二个参数:nGram_L分词窗口宽度下限值,默认为2
第三个参数:nGram_U分词窗口宽度上限值,默认为5
使用使用该函数需要总和考虑准确率和效率,合理设置nGram_L
和nGram_U参数。数据集创建成功后,就可以使用匹配函数进行模糊匹配了。ETSimilaritySetSearchM用法和ETSimilaritySetSearch一样。该函数优先使用大窗口宽度进行查找,大窗口未查找到数据时,再使用小窗口查找。函数参数定义就不做重复介绍。大家可以使用样例数据测试