1、Minitab 中*括哪些随机数据和概率分布功能
*成随机数据根据一列数据或从选定的数据分布创建一个或多个随机数据列。在 Minitab 中,选择计算 > 随机数据。
要根据工作表中的数据创建随机样本,请选择来自列的样本。
要根据某特定分布创建随机样本,请指定该分布和相应参数。
指定随机数字*成器为随机数*成器指定一个起点,以便将来*成相同的随机数据集。在 Minitab 中,选择计算 > 设置基数。创建分布的 PDF、CDF 或逆 CDF。计算所选分布的 PDF、CDF 或逆 CDF。在 Minitab 中,选择计算 > 概率分布。
2、访问数据分布的方式
一组数据可按许多不同方式分布或散布。例如,掷骰子所得的数据可以是从 1 到 6 的随机整数值。制造过程所得的数据可以目标值为中心进行分布,也可以*括远离中心值的数据值。
可以通过图形、描述性统计量或者与理论分布的比较来评估数据分布:图形通过图形(如直方图),可以直接深入了解数据集的分布情况。直方图可以帮助您观测:
数据聚类是围绕单个值,还是具有多个峰值或模式。
数据是稀疏散布于宽广的范围,还是位于较小的范围。
数据是偏斜的还是对称的。
描述性统计量用于描述*含数字值的数据的中心趋势(平均值、中位数)和展开(方差、标准差)的描述性统计,这些统计添加了明细层并且可用于与其他数据集进行比较。理论分布最后,一些常见分布可通过正态分布、Weibull 分布和指数分布等进行标识和称呼。例如,正态分布始终为钟形,且沿均值对称分布。真实数据将只能接近于这些完全分布。如果存在紧密拟合,则可认为数据由给定分布进行了合理建模。可使用统计 > 质量工具 > 个体分布标识来确定最适合您数据的分布。
3、连续和离散概率分布
概率分布要么是连续概率分布,要么是离散概率分布,这取决于它们是定义连续变量还是离散变量的概率。
什么是连续分布? 连续分布描述连续随机变量的可能值的概率。连续随机变量是具有一组无限且不可计数的可能值(称为范围)的随机变量。 连续随机变量 (X) 的概率被定义为其 PDF 曲线下的面积。因此,只有值范围才能具有非零的概率。连续随机变量等于某个值的概率始终为零。 重量分布示例 连续正态分布可以描述成年男性的体重分布。例如,可以计算男性体重为 160 到 170 磅之间的概率。