凯特勒科技 - 专注提供云SPC,MSA软件解决方案
全国服务电话:0755-28457327 邮箱地址:YunSpc@163.com
散点图

介绍

使用 散点图(Scatter Plot chart) 可以调查一对连续变量之间的关系。散点图在一个坐标平面中显示一对经过排序的 x 和 y 变量。
评估数据与模型的拟合程度,以估计 X 和 Y 之间关系的强度。当关系较强时,回归方程会准确地对数据建模。

如果您有拟合回归线,请将指针放在拟合回归线上以查看回归方程和 R 平方值。R 平方值越大,回归方程对数据的建模越准确。 

用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。

通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。

散点图通常用于显示和比较数值,不光可以显示趋势,还能显示数据集群的形状,以及在数据云团中各数据点的关系。

散点图(S) 参数设置

参数设置

  • Y变量:在数据页签的Y变量列名称
  • X变量:在数据页签的X变量列名称
  • 散点图选项:系统提供简单和包含回归两种模式

散点图数据注意事项

数据必须包括一对或多对数字或日期/时间数据列。

每对数据列必须包含相同数量的行。数据中最多还可以包括三列用于分组的类别数据。

样本数量应当为中到大

虽然对于散点图所需的数据量没有正式的准则,但样本越大,就越能清楚地表示数据中的模式。当样本数量大约为40或更大时,含拟合回归线的散点图最有效。如果样本数量小于40,则拟合回归线可能不那么准确。

样本数据应当是随机选择的

在统计学中,随机样本用于对总体做出归纳,即推断。如果数据不是随机收集的,则结果可能无法代表总体。

按数据的收集顺序记录数据

通常,应当按照数据的收集顺序将数据记录到工作表中。然后,您就可以评估数据中与时间相关的模式。

散点图(S) 示例

例如,医疗研究者会创建散点图来显示人体的体重指数 (BMI) 和身体脂肪百分比之间的正相关关系。

结果解释

  • 回归拟合值m:回归拟合计算出直线的m值
  • 加权项总和:回归拟合计算出直线的c值