线性回归是数理统计中通过回归分析确定两个或多个变量之间数量关系的统计分析方法,应用广泛。其表达式形式为y=w'x e,其中e为误差服从均值为0的正态分布。

在回归分析中,只包含一个自变量和一个因变量,它们之间的关系可以用一条直线近似表示。这种回归分析称为一元线性回归分析。如果回归分析包含两个或两个以上的自变量,且因变量与自变量之间存在线性关系,则称为多元线性回归分析。

在统计学中,线性回归是使用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间的关系进行建模的回归分析。该函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,有多个自变量的情况称为多元回归。反过来,这应该通过由多个相关因变量而不是单个标量变量预测的多元线性回归来区分。)

在线性回归中,数据由线性预测函数建模,未知的模型参数也由数据估计。这些模型被称为线性模型。最常用的线性回归模型是,给定X值的Y的条件均值是X的仿射函数。一般来说,线性回归模型可以是给定X作为X的线性函数的Y的条件分布的中值或其他分位数.和所有形式的回归分析一样,线性回归也是关注给定x值的y的条件概率分布,而不是x和y的联合概率分布(多元分析领域)。