技术要点:把sklearn中模型的训练结果保存为文件,然后再从文件中加载训练结果直接使用,不需要反复进行训练。
本文以垃圾邮件分类为例,在下面的代码基础上进行改进并增加模型训练结果的保存与使用,问题描述与数据集下载请见下面的链接:
Python+sklearn使用朴素贝叶斯算法识别中文垃圾邮件
代码1(get_words_from_file.py):
代码2(贝叶斯垃圾邮件分类器_训练并保存结果.py):
代码3(贝叶斯垃圾邮件分类器_加载并使用训练结果.py):
运行结果: