本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
为因变量。
(i)将log(avgprc)对四个工作日虚拟变量(星期五作为基准)进行回归,其中包含一个线性时间趋势。有价格在一周之内系统变化的证据吗?
(ii)现在,增加变量wave2和wave3,它们度量了过去几天的浪高。这些变量个别显著吗?描述一种机制,使得海面越是风大浪急,鱼价就越高。
(iii)在回归中增加了wave2和wave3后,时间趋势有何变化?接下来会发生什么?
(iv)解释为什么回归中所有的解释变量都被安全地假定为严格外生的。
(v)检验误差中的AR(1)序列相关。
(vi)利用4阶滞后求尼威-韦斯特标准误。wave2和wave3的r统计量如何?与通常OLS的统计量相比,你预计它会变大还是变小?
(vii)现在,求第(ii)部分中估计模型的普莱斯-温斯顿估计值。wave2和wave3是联合显著的吗?
A、R2ˉ﹤R2
B、R2ˉ≥R2
C、R2ˉ只能大于零
D、R2ˉ可能为负值
A.残差项
B.回归常数
C.回归系数
D.回归余项
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机练习C8。)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧备择假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告的双侧p值。
(iv)在第(ii)部分的回归中,log(income)和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个地区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
利用MEAP00 O1中的数据回答本题。
(i)使用OLS估计模型
并用通常的格式报告你的结论。在5%的显著性水平上,每个解释变量都是统计显著的吗?
(ii)求出第(i) 部分中回归的拟合值。拟合值的取值范围是多少?它与math4的实际数据取值范围相比如何?
(iii)求出第(i)部分中回归的残差。哪类学校具有最大的(正)残差?对这个残差给予解释。
(iv)在方程中增加所有解释变量的平方项,检验它们的联合显著性。你会把它们放到模型中吗?
(v)回到第(i)部分中的模型,将因变量和每个解释变量都除以各自的样本标准差,并重新进行回归。(除非你还将每个变量分别减去了各自的均值,否则还应该包括一个截距项。)以标准差为单位,哪个解释变量对数学考试通过率具有最大的影响?
在以下市场态势预测方法中,最为严谨的是:
A 一元线性回归
B 二元线性回归
C 多元线性回归
D 逐步多元回归
A、解释变量为随机变量,被解释变量为非随机变量
B、解释变量为非随机变量,被解释变量为随机变量
C、解释变量和被解释变量都为非随机变量
D、解释变量和被解释变量都是随机变量
用到SMOKE.RAW中的数据。
(i)估计抽烟影响年收入(可能通过因病损失的工作日或生产力效应)的一个模型是
其中,cigs表示平均每天抽烟的数量。你如何解释民?
(ii)为了反映香烟消费可能与收入同时决定,一个香烟需求方程是
其中,cigpric表示每包香烟的价格(美分),而restaurn表示一个二值变量,并在这个人所定居的州有餐馆抽烟限制时等于1。假定这些变量对个人而言都是外生的,那么你预期y5和y6具有什么样的符号?
(iii)在什么样的条件下第(i)部分的收入方程可识别?
(iv)用OLS估计收入方程并讨论p,的估计值。
(v)估计cigs的约简型。(记住这就要求将cigs对所有外生变量回归。)log(cigprc)和restaurn在约简型中显著吗?
(vi)现在用2SLS估计收入方程。讨论的估计值与OLS估计值的比较。
(vii)你认为香烟价格和餐馆抽烟限制在收入方程中是外生的吗?