机器学习基石-1-机器学习介绍
- 本节内容
- What is Machine Learning?
- What is skill?
- Why use machine learning?
- When use machine learning?
- Key Essence of Machine Learning
- Fun Time
- Applications of Machine Learning
- Components of Machine Learning
- 相关术语
- Leaning Flow (for Credit Approval)
- Fun Time
- Machine Learning and Other Fields
- 数据挖掘(Data Mining)
- 人工智能(Artificial Intelligence)
- 统计(Statistics)
本节内容
本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。
What is Machine Learning?
学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。
机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。
机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。

What is skill?

Why use machine learning?
考虑编写一个应用:树木种类识别,如果实现编写一套判断树的代码,因为世界上树的种类太过繁多,可能需要很多工作量,并且在之后发现新树时,需要更新维护该代码,工作量很大且效果不好。
如果使用机器学习来实现树木种类识别,让机器先学习大量的数据(观察)得到经验后,树的识别效果可能更好。
When use machine learning?
什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。比如:
1 当人类没办法做一个复杂的系统,将所有的规律都写清楚。——比如机器人探测火星,没办法预测机器人在火星上会遇到什么情况,例如遇到坑,要怎么办,这就需要机器自己去学习怎么处理
2 没办法定义一个规则的时候——语音/可视化识别
3 人类无法快速进行决策的时候——股市交易
4 在大规模的数据下一个用户取向的问题——用户个性化的市场

Key Essence of Machine Learning
大致可归纳为三个条件:
1 事物本身存在某种潜在规律
2 某些问题难以使用普通编程解决
3 有大量的数据样本可供使用

Fun Time

Applications of Machine Learning
机器学习在我们的衣、食、住、行、教育、娱乐等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。

Components of Machine Learning
Metaphor Using Credit Approval

相关术语
输入 x
输出 y
目标函数 f
即最接近实际样本分布的规律
训练样本 data
假设 hypothesis
一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为g,g能最好地表示事物的内在规律,也是最终想要得到的模型表达式。

Leaning Flow (for Credit Approval)
对于理想的目标函数f,我们是不知道的,我们手上拿到的是一些训练样本D,假设是监督式学习,其中有输入x,也有输出y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示),H中包含了许多不同的hypothesis,通过演算法A,在训练样本D上进行训练,选择出一个最好的hypothes,对应的函数表达式g就是我们最终要求的。一般情况下,g能最接近目标函数f,这样,机器学习的整个流程就完成了。


Fun Time

Machine Learning and Other Fields
与机器学习相关的领域有:
数据挖掘(Data Mining)

人工智能(Artificial Intelligence)
机器学习是实现人工智能的一种方式。

统计(Statistics)

其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习可以广泛应用的领域,总得来说,他们之间没有十分明确的界线。
















