数据、大数据与人工智能学习笔记
智慧,是为达到特定目标而运用知识的能力,是创新所必须的前提条件。
知识,是可用于指导行动的信息。
信息,是提供决策的有效数据。
数据,是关于自然、社会现象和科学实验的定量或定性的记录。
例子1
不是大数据。
英国《卫报》利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。
分析:伤亡人数不是价值密度低的数据,而是价值高的数据,所以它属于传统数据的范畴,它只是改变了传统数据呈现的方式,也就是说,它通过这样一个在地图上标注红点的方式,把这个统计数据呈现在我们的面前,它只是一个数据呈现方式上的创新。
例子2
是大数据。
2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数进行比较,并建立一个特定的数学模型。最终Google成功预测了2009冬季流感的传播情况,时间比美国疾控中心提前了一周。
大数据与人工智能相关误区
结论:
1.大数据不能用来训练AI 。
2.AI会成为处理大数据的利器。
3.机器人将是大数据的重要来源。
分析:
1.大数据不能用来训练AI
大数据是价值较低的数据,而训练AI的数据是非常纯净的数据。比如训练深度学习机器去准确识别一根香肠,类似香肠的东西可能有香蕉、茄子等,要让机器准确识别出香肠,那必须由人工筛选出只包含单一香肠的数据图片,通过这些纯净的香肠图片,让机器分析图片的相似点,进而让机器达到高准确度的判断和识别。
2.AI会成为处理大数据的利器。
未来的数据将是成千上万,单靠人工是无法胜任这么庞大的数据量,而依靠机器协助能够更快的处理冗杂的数据,以便对其进行深入分析。
3.机器人将是大数据的重要来源。
未来如智能坐便通过收集患者便秘、痔疮等生理状况,给患者就医建议,并通过物联网实现在家就医,这也避免了因羞于隐私而耽误疾病的情况发生。
这类疾病数据被合理收集和利用,也将有利于医学行业的良性发展。
未来如智能睡枕可以收集使用者睡眠习惯,记录使用者打鼾、呼吸频率等数据,帮助使用者减少因为咽喉结构畸变导致的呼吸暂停等危险情况,还有其他应用,这里不再赘述。