本题要用到HTV.RAW中的数据。 (i)考虑一个加入了父母受教育程度变量的工资方程 表述原假设:父
本题要用到HTV.RAW中的数据。
(i)考虑一个加入了父母受教育程度变量的工资方程
表述原假设:父亲与母亲的受教育程度对log(wage)具有相同影响。
(ii)估计第(i)部分中的模型,同时谈谈你对β,和队大小的看法。
(iii)在5%的显著性水平上,相对于双侧备择假设,通过构造一个95%的置信区间来检验第(i)部分中的原假设。你得到的结论是什么?
本题要用到HTV.RAW中的数据。
(i)考虑一个加入了父母受教育程度变量的工资方程
表述原假设:父亲与母亲的受教育程度对log(wage)具有相同影响。
(ii)估计第(i)部分中的模型,同时谈谈你对β,和队大小的看法。
(iii)在5%的显著性水平上,相对于双侧备择假设,通过构造一个95%的置信区间来检验第(i)部分中的原假设。你得到的结论是什么?
第1题
本题使用LOANAPP.RAW中的数据。
(i)有多少个观测的obrat>40,即其他债务负担超过其总收入的40%?
(ii)在计算机习题C7.8中,去掉o brat 40的观测,重新估计第(iii)部分中的模型。white的系数估计值和t统计量将会怎样?
(iii)看起来对所使用的样本过度敏感吗?
第2题
本题利用HPRICE1.RAW中的数据。
(i)估计模型
并以通常的OLS格式报告结论。
(ii)当lotsize=20000,scrft=2500和bdrms=4时,求出log(price) 的预测值。利用6.4节中的方法,在同样的解释变量值的情况下,求出price的预测值。
(iii)就解释price中的变异而言,决定你是偏好第(i)部分中的模型,还是偏好模型
第3题
本题使用CRIME4.RAW。
(i)在数据集中增加每个工资变量的对数,然后用一阶差分估计模型。问这些变量的引入如何影响例13.9中那些司法变量的系数?
(ii)第(i)部分中的工资变量都有预期的符号吗?它们是联合显著的吗?试解释。
第4题
个简单方程为:。
(i)用OLS估计该方程, 为了后面的比较略去时期1。以通常的格式报告结果。
第5题
本题使用INJURY.RAW中的数据。
(i) 使用肯塔基州的数据, 增加male, married以及全套行业和工伤类型虚拟变量作为解释变量, 重新估计方程(13.12)。在控制了这些其他因素后, afchnge-high earn的估计值有何变化?这个估计值仍然统计显著吗?
(ii)你对第(i)部分中较小的R°有什么看法?这是否意味着这个方程无用呢?
(iii)用密歇根州的数据估计方程(13.12)。比较密歇根州和肯塔基州的交互项估计值。密歇根州的估计值在统计上显著吗?你对此如何解释?
第6题
用到MROZ.RAW中的数据。
(i)用log(hours)作为因变量重新估计教材例16.5中的劳动供给函数。将估计出的弹性(现在是常数)与教材方程(16.24)在平均工作小时数处所得到的估计值相比较。
(ii)在第(i)部分的劳动供给方程中,容许educ因遗漏了能力变量而成为内生变量。用motheduc和fatheduc作为educ的Ⅳ。记住,你现在在方程中有两个内生变量。
(iii)检验第(ii)部分2SLS估计中过度识别约束。这些Ⅳ通过检验了吗?
第7题
用到CONSUMP.RAW中的数据。
(i)在教材例16.7中,用教材15.5节的方法检验在估计教材(16.35)时的那个过度识别约束。你的结论是什么?
(ii)由于潜在的数据度量问题和信息滞后,坎贝尔和曼昆(CampbellandMankiw,1990)使用所有变量的二阶滞后值作为工具变量。只用,作为工具变量重新估计教材(16.35)。这些估计值与教材(16.36)中的那些估计值相比如何?
(iii)将gy,对第(ii)部分的Ⅳ回归,并检验gy,与它们是否充分相关。这一点为什么重要?
第8题
本题利用NBASAL.RAW中的数据。
(i)估计一个线性回归模型,将单场得分与联赛中打球经历和位置(后卫、前锋或中锋)联系起来。包括打球经历的二次项形式,并将中锋作为基组。以通常的形式报告结果。
(ii)在第(i)部分中,你为什么不将所有三个位置虚拟变量包括进来?
(iii)保持经历不变,一个后卫的得分比一个中锋多吗?多多少?这个差异统计显著吗?
(iv)现在,将婚姻状况加入方程。保持位置和经历不变,已婚球员是否更高效(就单场得分来说)?
(v)加入婚姻状况和两个经历变量的交互项。在这个扩展的模型中,是否存在有力的证据表明婚姻状况影响单场得分?
(vi)使用单场助攻次数作为因变量估计(iv)中的模型。与(iv)的结果有明显的差异吗?请讨论。
第9题
(i)利用PHILLIPS.RAW中的数据估计方程(10.2),并以通常格式报告结果。你现在有多少观测数据?
(ii)将第(i)部分的估计值与方程(10.14)中的估计值进行比较。特别是,额外增加的年份对于得到通货膨胀与失业交替关系的估计值是否有帮助?请加以解释。
(iii)现在仅用1997~2003年的数据进行回归。这些估计值与方程(10.14)中的估计值有何不同?利用最近7年数据所得到的估计值足以得到某些肯定的结论吗?请加以解释。
(iv)考虑这样的一个简单回归背景:我们从n个时间序列观测开始,然后把它们分成早期和晚期两个部分。在第一个时期我们有n1个观测,在第二个时期我们有n2个观测。根据本题前面部分的分析评价如下命题:“一般而言,利用所有n次观测得到的斜率估计值大致等于利用早期子样本和晚期子样本所得到的斜率估计值的加权平均,权重分别为n1/n和n2/n。”
第10题
算法设计:对于给定的实验和仪器配置情况,找出净收益最大的实验计划.
数据输入:由文件input.txt提供输入数据.文件第1行有两个正整数m和n,m是实验数,n是仪器数.接下来的m行,每行是一个实验的有关数据.第一个数是赞助商同意支付该实验的费用,然后是该实验需要用到的若干仪器的编号.最后一行的n个数是配置每个仪器的费用.
结果输出:将最佳实验方案输出到文件output.txt.第1行是实验编号,第2行是仪器编号,最后一行是净收益.
第11题
用到SMOKE.RAW中的数据。
(i)估计抽烟影响年收入(可能通过因病损失的工作日或生产力效应)的一个模型是
其中,cigs表示平均每天抽烟的数量。你如何解释民?
(ii)为了反映香烟消费可能与收入同时决定,一个香烟需求方程是
其中,cigpric表示每包香烟的价格(美分),而restaurn表示一个二值变量,并在这个人所定居的州有餐馆抽烟限制时等于1。假定这些变量对个人而言都是外生的,那么你预期y5和y6具有什么样的符号?
(iii)在什么样的条件下第(i)部分的收入方程可识别?
(iv)用OLS估计收入方程并讨论p,的估计值。
(v)估计cigs的约简型。(记住这就要求将cigs对所有外生变量回归。)log(cigprc)和restaurn在约简型中显著吗?
(vi)现在用2SLS估计收入方程。讨论的估计值与OLS估计值的比较。
(vii)你认为香烟价格和餐馆抽烟限制在收入方程中是外生的吗?