这是我参与8月更文挑战的第10天,活动详情查看:8月更文挑战
继续接单变量线性回归问题写。

依旧对于这个房价预测问题,如何选参数θ?
毕竟选择不同的值对结果有很大的影响。
现在给出一个图:

给这个图找出适宜的θ0和θ1,使求出的预测函数能更好的和给出的这几个数据点拟合。
首先要解决一个最小化问题。尽量减小假设输出结果和真实房价 差的平方。
minimize:∑i=1m(h0(x(i))−y(i))2
求取所有的样本点的y与h0(x)差的平方和。
上一个公式我们可以得到平均误差:m1∑i=1m(hθ(x(i))−y(i))2
而实际上我们所要求的θ0和θ1应该满足使2m1∑i=1m(hθ(x(i))−y(i))2得到最小值。
对于上图给出的图像,使用的代价函数就是:
J(θ0,θ1)=2m1∑i=1m(hθ(x(1))−y(i))2
θ0,θ1misimize —— J(θ0,θ1)
Cost function is allso called the squared error function or sometimes callled the square error cost fonction
代价函数也被称作平方误差函数有时也被称为平方误差代价函数。
平方误差代价函数只是代价函数的一种,是解决回归问题最常用的手段之一。
举个栗子
In order to better visualize the cost function J.We are going to work with a simplified hypothesis function.
为了使代价函数J更好的可视化,我们先使用一个简化的假设函数。
假设现在的预测函数为hθ(x)=θ1x,即θ0=0。
那代价函数就可以简化为J(θ1)=2m1∑i=1m(hθ(x(i))−y(i))2
θ1minimizeJ(θ1)
假设现在我们的训练集如下,给出一个图:

当θ1=1时候
hθ(1)−y1=0hθ(2)−y2=0hθ(3)−y3=0
J(θ1)=2m1∑i=1m(hθ(x(i))−y(i))2=0
当θ1=0.5时候
hθ(1)−y1=−0.5hθ(2)−y2=−1hθ(3)−y3=−1.5
J(θ1)=2m1∑i=1m(hθ(x(i))−y(i))2=2×31(0.25+1+2.25)=0.583333
……
依次计算下去,最后得到代价函数J是个一元二次函数:

所以在这个例子中当θ1=1时候代价函数取得最小值,拟合函数最精确。
既然理解了简化过的代价函数,那现在看一下没简化过的。
给出数据如图所示:

但是此时代价函数并不是二维图形了。因为多了一个参数θ0,所以变为三维图像,例如下图:

但是为了便于表示,之后不会继续使用三维图像,而是使用等高图像(回忆一下小时候学地理时候的等高线等温线之类的), 类似于下图:

同一条线上的点代表虽然θ0和θ1不同,但是他们代价函数值相同。