参数设置
- Y变量:在数据页签的Y变量列名称
- X变量:在数据页签的X变量列名称
- 散点图选项:系统提供简单和包含回归两种模式
使用 散点图(Scatter Plot chart) 可以调查一对连续变量之间的关系。散点图在一个坐标平面中显示一对经过排序的 x 和 y 变量。
评估数据与模型的拟合程度,以估计 X 和 Y 之间关系的强度。当关系较强时,回归方程会准确地对数据建模。
如果您有拟合回归线,请将指针放在拟合回归线上以查看回归方程和 R 平方值。R 平方值越大,回归方程对数据的建模越准确。
用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。
通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。
散点图通常用于显示和比较数值,不光可以显示趋势,还能显示数据集群的形状,以及在数据云团中各数据点的关系。
每对数据列必须包含相同数量的行。数据中最多还可以包括三列用于分组的类别数据。
虽然对于散点图所需的数据量没有正式的准则,但样本越大,就越能清楚地表示数据中的模式。当样本数量大约为40或更大时,含拟合回归线的散点图最有效。如果样本数量小于40,则拟合回归线可能不那么准确。
在统计学中,随机样本用于对总体做出归纳,即推断。如果数据不是随机收集的,则结果可能无法代表总体。
通常,应当按照数据的收集顺序将数据记录到工作表中。然后,您就可以评估数据中与时间相关的模式。
例如,医疗研究者会创建散点图来显示人体的体重指数 (BMI) 和身体脂肪百分比之间的正相关关系。