宝鸡文理学院2014年数学建模
培训第二次模拟
                          B
姓名
系别
赵朋飞
数学系
201290014087
王文鹏
计科系
201296014053
叶鹏
物理系
201291024078


出租车数量的估计问题
摘要
本文运用概率统计的思想,解决了出租车数量的估计问题。依据题目要求,我们建立了两种估计模型,估算出了该小镇出租车的数量,并且对模型的可靠性进行了检验。
对于模型一:首先,题目所给样本数据是随机的,通过MATLAB软件作图,发现区间间隔为时,落在每个区间车牌号数量是均匀分布的,即车牌号服从于均匀分布。而车牌号又是按顺序排列的,所以样本中的最小车牌号与最大车牌号趋近于该市机动车出租车车牌号的起始号与终止号,试假设该机动车出租车车牌号区间为,进而求出该市机动车出租车的总数量为excel中值公式函数辆;然后,对于样本中所给的出租车牌号,经过后减运算,得到每两个相邻的车牌号之间间隔的车牌号数量,用EXCEL软件排序并作图,剔除了极端差值,其余求其平均数,即每辆出租车车牌号之间间隔平均是;最后计算出该小镇出租车的数量辆。
对于模型二:由于模型一中确定该市机动车出租车车牌号区间不甚精确,我们考虑对其进行优化。首先,我们运用了两种方法估计了该市机动车的总数量:方法一,引用盟军估计德军坦克数量的模型估计出该市机动车的总数为;方法二,运用极大似然估计函数确定该市机动车出租车的车牌号区间为,经端点值作差得出该市机动车出租车的总数为;(这两种方法貌似得去掉一个)将两种方法(去掉)所求的该市机动车总数均值作为该市机动车最终数量然后,把样本的车牌号每隔进行统计,得到每个车牌号中的出租车车牌数量,对得到的数据用SPSS软件进行检验,显示呈正态分布并得其均值,采用极大似然估计法求得正态分布总体中参数,即该市每机动车出租车中有辆出租车属于分配在该小镇。最后计算出该小镇有出租车辆。
综合两种模型,模型一对机动车车牌号范围的区间估计不够精确,而模型二在估算机动车牌号范围的区间时,恰当运用盟军估计德军坦克数量模型与极大似然估计法,比较精确地求得该市机动车的数量。另外,模型二对车牌号分区间考虑使得估算更为合理。模型检验中偏态系数与峰度系数对统计数据的分析使得模型更为完善(改为)最后我们对两种模型的优缺点进行了讨论。
关键字:极大似然估计  正态分布  SPSS软件  偏态系数  峰度系数
一、问题重述
小张寒假回到他的家乡某小镇,在出门探亲访友过程中,他发现小镇的出租车,存在诸多问题。他打算从小镇的出租车数量入手,解决这些问题。在接下来的几天时间里,他随机的记录了133辆出租车车牌号的后5位见附录1。他只知道车牌号是按顺序排列的,但他不知道车牌的起始号,也不知道车牌的终止号,他希望通过上述数据估计出小镇的出租车数量。
要求帮助小张设计一种或多种数学模型,来估计小镇出租车的数量,并分析方法的可靠性。
二、模型假设
1、 样本统计过程中没有考虑外来车辆。
2、 该市机动车的车牌号连续。
3、 该市机动车与车牌号一一对应。
4、 该市机动车车牌号的后五位均由数字组成。
三、符号说明
符号
含义
该市机动车数量
原始车牌号序列
样本相邻车牌号的差值序列
差值的平均值
俩车牌号的间隔
小镇出租车数量
样本均值
样本方差方差
样本中最小的车牌号
样本中最大的车牌号
样本中车牌号的数量
该市机动车下限的最大似然估计值
该市机动车上限的最大似然估计值
总体均值
组中值
对应比重
偏态系数
峰度系数
四、问题分析
本题属于概率统计问题。要估算出该小镇出租车的数量,首先需要估算出该市机动车出租车的数量。考虑到题目所给样本数据是随机的,通过MATLAB软件作图,发现区间间隔为时,落在每个区间车牌号数量是均匀分布的,即车牌号服从于均匀分布。我们可以采用点估计,即以实际样本指标数值作为总体参数的估计值,估算出该市机动车的数量,进而估计出小镇出租车数量。我们可以从以下两种思路来求解: 
思路一:由于样本中的车牌号均匀分布,考虑到所在地为小镇且车牌号是按顺序排列的,所给车牌号码的最小值与最大值就非常趋近于起初号和终止号,所以假设车牌号区间为[2400031999]。经过后减运算,剔除坏数据,得出每两辆车牌号之间相差的个数,从而得出小镇出租车的数量。 
思路二:对思路一中确定总体车牌号区间存在的不精确性,我们将其进行优化,可以用点估计[1]与极大似然函数(和摘要对应,去掉一种方法)确定总体的车牌号区间。参照点估计中最小无偏估计,采用较为准确的计算公式确定车牌号区间,即为该市机动车总数,当然,我们还可以利用极大似然函数确定车牌号区间。(与上对应,去掉一种方法)其次,将样本的车牌号每隔进行统计,得到的统计数据求其平均值,把所得平均值与机动车总数的千分之一的乘积作为该小镇出租车数量的估计值。