AI 算法基本是开源的(开放源代码),哪怕并不了解算法原理,也可以调用文字识别、图像识别、人脸识别、语音识别的算法。比如,语音识别:
这样的算法是靠数据喂出来的,信息就是钱......当我们无法收集到他人所没有的信息时,我们的算法再好,也无法很好的消除不确定性。要消除不确定性,就需要不断的寻找新的信息。
可惜我们并没有训练算法的大量数据,这些数据往往掌握在大企业里,如:谷歌/百度有搜索数据,Facebook/腾讯有社交数据,亚马逊/阿里有商业行为数据……
所以,我们在此汇总了一些开放的大数据平台, 可以做数据的获取和分析。
Quandl:经济和金融数据,有助于建立预测经济指标或股票价格的模型。理杏仁:提供A股、B股、港股、美股以及行业、指数等历史估值数据、财报数据、博弈数据。天天基金网 查看基金业绩,规模、持仓、基金经理的基本信息。
机器学习入门阶段:
机器视觉:
情绪分析:
自动驾驶:
自然语言处理:
一般能打起数据官司的,不是侵犯了【隐私】就是【版权】。
如果要做与个人相关的研究,敏感信息要脱敏;如果是传统企业,那么多年,积累下来的数据就是一笔非常宝贵的财富。
可以选择和缺乏数据,但有技术的企业合作,比如美国的 Splunk公司。但是,一定要考虑的是,这份数据的所有权。