第1题
令d表示一个(二值)虚拟变量,并令:表示一个定量变量。考虑模型
这是含有一个虚拟变量和一个定量变量之交互作用的一般性模型[方程(7.17)中有一个例子]。
(i)由于没有重大变化,所以取误差为u=0。于是,当d=0时,我们可以把y和z之间的关系写成函数f0(z)=β0+β1z.当d=1时,同样写出y和z之间的关系,其中左边应该使用f(z),以表示Z的线性函数。
其中所有系数和标准误都保留到小数点后三位。利用这个方程,求出使得男女log(wage)的预测值相等的totcoll值。
(iv)基于第(iii)部分中的方程,女人能现实地获得足够多的大学教育而赶上男人的工资吗?请解释。
第2题
在例7.2中,令noPC表示一个虚拟变量:没有一台个人计算机的学生取值1,否则取值0。
(i)如果用noPC取代方程(7.6)中的PC,所估计方程的截距会怎么样?noPC的系数是多少?
(ii)如果用noPC取代PC,R2会有什么变化?
(iii)PC和noPC应该都作为自变量包括进模型中吗?请解释。
第3题
其中,PRICEl表示门票价格(可能以真实价格度量,比如通过地区消费者价格指数进行平减),WINPERCl表示球队当前获胜的概率,RIVALl表示一个标志着比赛是否势均力敌的虚拟变量,而WEEKEND表示一个标志着球赛是否在周末进行的虚拟变量。I表示自然对数,所以这个需求函数具有常价格弹性。
(i)为什么在这个方程中有一个时间趋势是个好想法?
(ii)门票供给由体育馆的容量所固定;假定这个供给10年不变。这意味着供给的数量不随价格而变化。这意味着价格在这个需求方程中必然是外生变量吗?(提示:回答是否定的。)
(iii)假设门票的名义价格缓慢变化(如在每个赛季之初)。体育委员会部分基于上赛季的平均售票和该队上赛季的胜率来选择价格。在什么样的条件下,上个赛季的胜率(SEASt-1)是IPRICEt一个有效的工具变量?
(iv)在方程中包括男子篮球比赛的真实价格(的对数)看起来合理吗?请解释。经济理论预测其系数的符号是什么样的?你能想到另外一个与男子篮球相关而又属于女子观众方程的变量吗?
(v)如果你担心某些序列(特别是IATTEND和IPRICE)有单位根,你如何改变所估计的方程?
(vi)如果某些比赛的门票售空,这会导致估计需求方程出现什么问题?(提示:如果门票售空,你一定观察到真实需求了吗?)
第4题
为了确定使用避孕套对于减少有性行为的高中生之间性疾病的传播是否有效,一个简单的模型为
其中,infrate表示有性行为的学生中感染性病的比例,conuse表示声称合理地、有规律地使用了避孕套的男孩子比例,avginc表示平均家庭收入,而city则是一个表示所在学校是否处在城里的虚拟变量;这个模型是在学校这个层次上做的。
(i)在因果性和其他条件不变的模式下解释上述方程,的符号应该是什么?
(ii)为什么infrate和conuse可能是联合决定的?
(iii)如果避孕套使用率随着性病感染率的提高而提高,所以在方程
courseγ0+γ1infrate+其他因素
中y1>0,那么用OLS估计β1时可能的偏误是什么?
(iv)令a表示一个二值变量,若学校有分发避孕套项目则取值1.解释这如何利用这一变量对通过β1(和其他系数)进行Ⅳ估计。我们必须在每个方程中对condis做怎样的假定?
第5题
其中,为逻辑斯蒂函数。对于一个具有12年教育经历的40岁的人来说,高中阶段受到过职业培训对其目前生活在贫困中的影响是什么?这个影响大吗?
第6题
设计一个point(点)类: (1)该类具有成员变量x,y(表示点的横、纵坐标); (2)定义一个有参构造方法point(int x,int y),将其一对坐标值作为参数,其中x,y为给定坐标值; (3)定义一个无参的构造方法point()(令两坐标值均为0); (4)设计一个实例方法distance(point p1,point p2),实现求坐标轴上两个点的距离(Java中的开平方根函数为Math.sqrt()),其方法的声明为:double distance(point p1,point p2) 。 编写Test类,在其main方法中创建2个point对象,对应点(10,10)和点(20,25),再调用distance(point p1,point p2)方法计算出两点之间的距离并输出该值。
第7题
(i)在方程(11.27)中添加一个线性时间趋势。在一阶差分方程中,时间趋势是必要的吗?
(ii)从式(11.27)中去掉时间趋势并添加变量ww2和pil(不要对虚拟变量进行差分)。这两个变量在5%的水平上是显著的吗?
(iii)用第(ii)部分中的模型估计LRP并求出其标准误。与从式(10.19)得到的结果相比较,在式(10.19)中gfr和pe是以水平值形式而非差分形式出现的。
第9题
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
第10题
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
第11题