1、最小二乘的使用前提:存在一条直线,注意是直线,不是曲线!
用数学表示就是,y=ax+b。
2、虽然直线函数中,虽然变量是x、y,但是实际上使用过程中,我们求的却是a,b
“实际上,我们并不关心x和y到底是多少,因为x和y是给定的,当然x和y与其本质的内在关系之间肯定存在误差。我们关心的是方程中的a和b,也就是说,在这个待定的方程中**,a和b才是所求的变量**,它们可以描述出x和y的关系。 所以我们接下来的任务就是找到一组最好的a和b。”
3、我们对a和b的要求就是,使得所有x和y相对拟合直线的误差总和最小。也就是说,我们要考虑的是,要使这些数据点距离拟合直线的和最小,距离最短,这样就可以使得尽可能多的数据成为有效点。
接下来我们的工作就是,最小化误差了。
最小二成法就此登场。
4、最小二乘法名字的缘由有两个,一是我们要将误差最小化,二是我们将误差最小化的方法是使误差的平方和最小化。误差最小化的原因前已述及,用误差平方和最小化来约束误差的原因是要规避负数对计算的影响。
最小二乘这个名字的核心影响因素是“负数”
|