从人工智能开始
让机器具有人类的智能,能够理解人类语言、语音、图片、视频以及各种人类活动数据,并以此为依托辅助甚至代替人类做出决策,是人工智能的终极目标。最早提到机器智能的是图灵,1950年,他提出机器是否拥有智能的测试方法为:一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答。如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机是智能的,而该测试也称为图灵测试。1956年的达特茅斯(Dartmouth)会议。在这次会议上,“人工智能”被提出并作为本研究领域的名称。同时,人工智能研究的使命也得以确定。John McCarthy提出了人工智能的定义:人工智能就是要让机器的行为看起来就象是人所表现出的智能行为一样。
- 机器感知(计算机视觉、语音信息处理)
- 学习(模式识别、机器学习、强化学习)
- 语言(自然语言处理)
- 记忆(知识表示)
- 决策(规划、数据挖掘)


如何开发一个人工智能系统?

机器学习 :波士顿房价预测
主要根据历史成交数据,主要包括房屋面积,卧室数,房屋年龄以及最终成交价格来预测待售房屋大概的成交价格,现在非常成熟的房产估值用的也是这一套,只不过更加严密,特征更多,包括房屋周边便利店、绿化情况、距离加油站的距离等等非常多的信息,影响房屋价格的所有因素称之为特征,对特征的各种处理变换称之为特征工程。

特征工程问题
在实际应用中,特征往往比机器学习模型更重要
- 预处理:经过数据的预处理,如去除噪声等。比如在文本分类中,去除停用词等。
- 特征提取:从原始数据中提取一些有效的特征。比如在图像分类中,提取边缘、尺度不变特征变换特征等。
- 特征转换:对特征进行一定的加工,比如降维和升维。降维包括
- 特征抽取(Feature Extraction): PCA、LDA
- 特征选择(Feature Selection):互信息、TF-IDF

深度学习
深度学习=表示学习+浅层学习

其数学描述如下:当f(x)=σ(Wlx)时为神经网络!y=f(f(f(f...(x)))))为深度神经网络(在图像识别中神经网络做到几十上百层司空见惯,上千层都算正常)。
- 模型:神经网络
- 学习准则:交叉熵损失等
- 优化:随机梯度下降

为什么现在才展示威力?
缺点:参数过多、影响训练、非凸优化问题、存在局部最优而非全局最优解、梯度消失、下层参数比较难调、参数解释性差。

深度学习的三个步骤[2]

常用的深度学习框架


- 简易和快速的原型设计
- 自动梯度计算
- 无缝CPU和GPU切换
人工智能一些常见应用
1、图像文本提取:即提取出图像中的文本,也称OCR,用于身份证识别、银行卡识别、验证码识别等,该技术已成熟并产品化。
2、文本图像视频等分类:用于电商文本情感分类、政治反动、暴力社情文本的监控等,该技术较为成熟。
3、错词纠正:主要用于自动对检索中用户输入的错别字进行纠正,完善用户体验,该技术尚不成熟。
4、文章摘要:主要用于新闻文本的缩写,该技术尚不成熟。
5、文本翻译:即将文本从一种语言翻译到另一种语言,该技术较为成熟。
6、自动问答:即让计算机自动回答客户问题,该技术尚不成熟。目前机器阅读理解能力很低。
7、异常检测:对于摄像头突发暴力事件等自动检测与报警提醒,防止违法视频的传播等,该技术较为成熟。
8、目标追踪:实时追踪视屏中目标的轨迹,该技术较为成熟。
参考
- ^https://www.quora.com/How-do-you-explain-Machine-Learning-and-Data-Mining-to-non-Computer-Science-people
- ^1天搞懂深度学习 http://speech.ee.ntu.edu.tw/~tlkagk/slide/Tutorial_HYLee_Deep.pptx


















