除了预测商品价格以外,我们也可以运用依据平均值进行预测的方法检验其他数据,本文就采用预测商品普及率的样例介绍。这次选用的数据是一项问卷调查的结果。通过调代,收集数据,求出预测值后与实际值作比较。
日本内阁府经济社会综合研究所曾进行了一项关于国民消费趋势的调查,笔者抽取其中的关于每年普通家庭耐用品晋及率的数据做成表格,如下图。
由于耐用品是物品,所以使用用平均值中的“几何平均值”预测普及率,并与实际普及率作比较检验误差.
如何发现偏差值
收集的数据中,经常出现比其他数据极端大或极端小的数值,即“偏差值”。偏差值又叫异常值、离群值、特殊值等.在数据挖掘中,发现偏差值并分析其产生的原因或理由非常重要。发现偏差值后需要将其排除,但同时也能从中发现到目前为止未能确认的有效信息或特征。偏差值也许是含有宝藏的原矿石,其中隐藏了发现新结果的可
根据上图所示物品,抽取电脑、洗碗机、数码相机进行问卷调查。为了预测2005年的普及率,收集了20个认为比例偏高或偏低的回答结果。求解总体回答结果的最具代表性的平均值(简单算术平均值),得出认为偏高、认为偏低的几何平均值,如下图所示:
比较预测值与实际结果。利用几何平均值得到的预测数值与实际普及率之间的相对误差,三个项目分别是3.8、-17.l、0.9,没有较大差异(表2.10)。特别是数码相机,相对误差仅有0.9%,其预测结果与实际普及率几乎相同。
用Excel预测牛奶的期望价格
这次使用“食品”检验数据,我们采取用Excel预测牛奶的期望价格的案例。首先求解三种乎均值,然后和实际的牛奶价格作比较。下图的数据与上一篇文章《用Excel预测女衬衫的期望价格》中的女衬衫的数据相似,是消费者购买l升牛奶时“认为偏高的价格”和”认为偏低的价格&