第1页共9页我国股民过度自信与交易的正态性进行了检验,发现无论是偏度还是峰度我们都能在小于0.001的水平上拒绝序列服从正态分布的假设。为了解决这一问题,我们采用bootstrap的方法。我们知道要想对统计量的精确性进行衡量我们首先需要确定其样本分布。如果事先知道总体分布,或者先验的对总体分布状况进行了假定,我们就可以从总体中随机抽取n个样本,计算出统计量的值。bootstrap的方法与之不同之处在于,他是利用观测到的样本分布作为真实总体分布的替代。同时,bootstrap产生出一个样本分布的bootstrap分布,利用bootstrap分布,我们可以估计出统计值的标准差以及置信区间等指标。举例来说,假设我们的样本有n个观测值,利用这n个观测值我们可以计算出某个估计量,但是由于我们不清楚样本的分布情况,我们就无法利用t统计量或者其他统计量对的置信区间进行界定。但是,我们可以利用放回抽样的方法随机的从这n个观测值中抽取m个,然后利用这m个值计算出一个估计量。重复上述操作k次,我们可以得到一个序列,利用该序列我们可以估计出的bootstrap分布,然后利用该分布计算出的置信区间等指标。随着计算机处理数据能力的提高,近些年来,bootstrap的方法得到广泛的应用。尤其当我们遇到样本观测值存在相关性或者说样本存在偏斜分布(skeweddistribution)问题的时候,bootstrap方法为我们提供了一个很好的估计置信区间的方法。kothari和warner(1997)认为,该方法“为一些旨在降低设定错误(misspecification)的替代检验提供了一个很有前景的框架。〞lyon,barber和tsai(1999)验证了这种方法的接受率和拒绝率(acceptanceandrejectionrate),发现对于随机样本来讲,该方法非常有效。在本文中,我们利用统计软件stata提供的软件包直接计算出统计量的偏差矫正(bias-corrected)置信区间。在bootstrap过程中,所有计算的重复操作次数均取为500次,同时,我们利用全部样本进行重复抽样(即m=n)。四、检验结果第2页共9页a、根本结论表三给出了本文的根本结论。其中,panela是1999-2022年期间所有投资者交易股票的市场回报率情况;panelb是所有投资者在1999-2022年间交易股票的市场回报情况;panelc是所有投资者在2022-2022年间交易股票的市场回报情况。表三:在交易发生之后的t天内交易股票的市场回报率panela:1999-2022年所有投资者21个交易日42个交易日84个交易日买进-0.020238-0.020236-0.0167卖出0.00450.0040-0.0017差值-0.0123-0....