python机器学习及实践
什么是机器学习
如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认定为是“具有学习能力的”,那么它一定需要展现出,利用现有经验(E)不断完善其任务(T)的性能(P)的特质。
机器学习三要素
任务、经验、性能
机器学习类别
监督学习
对未知事物的表现和预测,其主要包括分类问题(classification)和回归问题(regression)
分类问题的缺陷:就是对所有需要预测的类别都是已知的,如果是新的物种我们便无法根据现有经验进行判断
无监督学习
无监督学习倾向于事物本身的特性分析,数据降维(Dimensionality Reduction)和聚类问题(clustering)
为什么使用python作为机器学习的语言
方便调试的解释型语言
跨平台作业执行
广泛的编程应用接口
丰富完备的工具包
如 pandas、numpy、scripy、matplotlib、scrikit-learn