代码功能:统计一个字符串中所有字符在另一个字符串中出现的总次数。
技术要点:函数式编程。
可能的应用:垃圾邮件分类。在大部分垃圾邮件中,为了防止被分类为垃圾邮件,会在一些关键字中间插入类似于【、】、*之类的字符来干扰分词。可以把这个特点作为一个判断依据,如果一封邮件中这样的干扰字符超过一定比例,则认为是垃圾邮件。
参考代码: