Andrew Ng Machine Learning

此文是斯坦福大学,机器学习界 superstar — Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记。力求简洁,仅代表本人观点,不足之处希望大家探讨。 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome

Week 1: IntroductionEnvironment Setup Instructions 这一章介绍课程一般使用的工具。octave或者matlab即可,,这两者本质上没有什么区别,都有着丰富的数学库计算库。Introduction 机器学习定义:简单来说,让计算机执行一些行为,但是without explicit programmed。监督学习(supervised learning):通过已知的正确信息,得到未知的信息。一般用于解决的问题有两类: 例如:肿瘤分类。已知肿瘤size与肿瘤良性(label: 0)还是恶性(label: 1)分类的关系如下:

更进一步,完全可以用一维坐标图来表示:

现在需要对于根据size的对某个肿瘤判断它是良性还是恶性,就是分类问题。再进一步,现在我仅仅把size作为feature之一,如果我们加入考虑肿瘤积水(二维坐标图)?肿瘤硬度(三维坐标图)?原则上可以考虑无限种feature,如何处理?这里卖了个关子,可以使用支持向量机(SVM)。无监督学习(unsupervised learning)/ 聚类算法(clustering): Bonus: Course Wiki Lecture Notes

Model and Cost Function

再次回顾一下监督学习,两类:regression和classification。简单来说,regression是predict real-valued output,classification是predict discrete-valued output。

注明了以下符号,方便以后沟通:

:训练集样本的个数 :一组样本 行中的数据 :就是我们用于predict的mapping,即函数

我们设计拟合,目的就是为了使得表示拟合数据与已知真实数据直接差距的cost function最小,这个cost function是啥?就是我们之前提到的判断标准,常见的为:。当有两个未知量时,cost function就需要表示为三维图:

为了方便表示,也可以把上图表示为类似地理上的“等高线”。术语称为 contour plot(轮廓图):

Parameter Learning

现在,我们开始具体来看看,第一个机器学习算法:梯度下降法(gradient descent)

target: algorithm:

Linear Algebra Review

Week 2:Linear Regression with Multiple Variables 笔记:

却还是,会愚蠢的选择相互敌视的方式。即使背脊相抵,

Andrew Ng Machine Learning

相关文章:

你感兴趣的文章:

标签云: