数据集SMOKE.RAW包含美国成人个人随机样本在抽烟行为和其他变量方面的信息。变量cigs为(平均)每
数据集SMOKE.RAW包含美国成人个人随机样本在抽烟行为和其他变量方面的信息。变量cigs为(平均)每天抽烟的数量。你是否认为在美国这个总体中,cigs具有正态分布?试做解释。
数据集SMOKE.RAW包含美国成人个人随机样本在抽烟行为和其他变量方面的信息。变量cigs为(平均)每天抽烟的数量。你是否认为在美国这个总体中,cigs具有正态分布?试做解释。
第1题
本题用到SMOKE.RAW中的数据。
其中, cig pric表示每包香烟的价格(美分) , 而restaur n表示一个二值变量, 并在这个人所定居的州有餐馆抽烟限制时等于1。假定这些变量对个人而言都是外生的,那么你预期y5和y6具有什么样的符号?
(iii)在什么样的条件下第(i)部分的收入方程可识别?
(iv)用OLS估计收入方程并讨论岛的估计值。
(v)估计cigs的约简型。(记住这就要求将cigs对所有外生变量回归。) log(cig pric) 和restaur n在约简型中显著吗?
(vi)现在用2SLS估计收入方程。讨论β1的估计值与OLS估计值的比较。
(vii)你认为香烟价格和餐馆抽烟限制在收入方程中是外生的吗?
第2题
ize) 方面的信息, 以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题, 只使用单身者数据(fsize=1)。
(i)数据集中有多少单身者?
(il)利用OLS估计模型
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H1:β2<1检验H0:β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归, inc的斜率估计值与第(ii) 部分的估计值有很大不同吗?为什么?
第3题
薪水信息和职业统计。
(i)估计一个将每场得分(points)与加入联盟年数(exper)、年龄(age)、大学期间打球年数(coll)相联系的模型。包含一个exper的二次项,其他变量都应该以水平值形式加入模型。按照通常的格式报告结果。
(ii)保持大学打球年数和年龄不变,从加入联盟的第几个年份开始,在NBA打球的经历实际上将降低每场得分?这讲得通吗?
(iii)你为什么认为coll具有负系数,而且统计显著?(提示:NBA运动员在读完大学之前被选拔出,甚至直接从高中选出。)
(iv)有必要在方程中增加age的二次项吗?一旦控制了exper和coll之后,这对年龄效应意味着什么?
(v)现在将log(wage)对points,exper,exper2,age和coll回归。以通常的格式报告结论。
(vi)在第(v)部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历,这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义?
第7题
关于MNIST,下列说法错误的是()。
A.是著名的手写体数字识别数据集
B.有训练集和测试集两部分
C.训练集类似人学习中使用的各种考试试卷
D.测试集大约包含10000个样本和标签
第9题
A.进行并运算的两个关系必须具有相同数目的行个数
B.进行并运算的两个关系必须具有相同数目的行个数和列个数
C.进行并运算的两个关系的列个数必须相同,对应列的语义相同
D.如果两个关系包含内容相同的数据行,则并运算结果将包含这些重复的数据行
第10题
下面关于三星公司基于ARM9内核的S3C2410嵌入式微处理器芯片的叙述中,错误的是()。
A.S3C2410包含32位嵌入式微处理器
B.内部具有分离的指令Cache和数据Cache
C.高速组件和低速外设接口均采用AHB总线
D.内部集成了存储器控制器