关于支持向量机的理论知识,大家可以查阅机器学习之类的书籍或网上资源,本文主要介绍如何使用Python扩展库sklearn中的支持向量机实现数字图片分类。
1、首先编写代码生成一定数量的含有数字的图片
上面代码运行会生成80000张含有数字0到9的图片,并加入随机干扰,交换相邻两个像素的颜色。生成的图片如下:
其中,每张图片加入干扰的效果如下:
2、然后编写代码,加载生成的图片文件
3、最后编写代码,使用Python扩展库sklearn中的支持向量机算法对生成的图片中除最后1000张之外的图片进行训练,并使用训练好的模型对最后1000张图片进行分类。
4、下面的运行结果显示了预测的准确率,前3个结果是40000张图片训练和分类的,每次运行用时约1.5小时,最后一个结果是80000张图片训练和分类的,用时约7.5小时。