社会经济调查数据分析——2013年秋季学期双学位课程介绍

发布日期:2013-09-13 07:04    来源:北京大学国家发展研究院

Social Science Survey Data Analysis

社会经济调查数据分析

2013年秋季

北京大学国家发展研究院

 

任课教员:赵耀辉

上课时间:周六、日:第九、十节(17:40-19:30)

上课地点:周六:二教109,周日:理教203

助教:张戈

学生导师:王亚峰、赵锐、田萌、商华磊、顾家栋、许文健、张戈、苏诺雅

先修课:社会经济调查理论方法与实践或者参加CHARLS实地调研

学分:4

 

课程介绍

 

本 课是为完成了中国健康与养老追踪调查的访员同学开设。通过培训课程和实地调研,学生们已经熟悉了调查数据收集的过程,获得了关于老百姓如何生活、工作、如 何与家人和社会交往的一手材料。本课将教会学生如何利用这些数据开展研究工作、撰写研究论文。具体来说,学生将学习如何使用Stata统计软件处理数据,如何制作描述性的统计表格,如何进行比较复杂的统计分析,以及如何使用数据写作研究论文。

 

本 课将分为课时大致相等的四个部分,第一部分讲授统计软件的使用方法,使学生可以对调查数据做基本操作和制作描述性统计表格。第二部分是讲授统计学知识,使 学生了解如何利用调查数据做比较深入的回归分析,以及如何解释回归结果。第三部分讲授和练习使用调查数据写作研究论文的方法。第四部分是就学生的论文选题 进行集中专题指导。

 

在 教学内容的前三部分,即数据操作和统计描述表格制作、回归分析以及论文写作技巧,是以教员讲授为主,辅以课堂辅导和课外练习,第四部分,即研究指导,以学 生报告为主,辅以教员对学生研究设计的评论和指导。学生的论文报告占比将控制在四分之一以内。教员将对所有作业进行评定,对论文进行反馈。

 

本课的前半部分将每周布置作业,学期中间将有一篇小论文的要求,期末将提交一篇完整的研究论文。成绩比例为:作业35%,小论文25%,期末论文40%。

 

 

参考书:Donald Treiman, 《量化数据分析,通过社会研究检验想法》,任强译,社会科学文献出版社,2009

 

课程安排(初步版,可能根据情况进行调整):

课次

时间

题目

1

9月14日

课程介绍:什么是研究?如何确定研究题目?研究的程序是什么?

 

 

作业:下载CHARLS基线数据;装载stata程序;写一段文字说明你感兴趣研究什么问题

2

9月15日

如何组织文档;如何组织stata codes;用stata读取数据;stata基本操作

 

 

作业:做一个表格,描写CHARLS所有数据库的变量数量、观测值数量;写一段描写数据的文字。

3

9月21日

变量分类;变量描述(histogram;pie charts;描述性统计)

 

 

作业:根据你感兴趣的题目,挑选问卷中的相关问题;做表格描述这些变量;写一段文字来描述变量特征。

4

9月22日

数据清理:如何识别、处理outlier;code open-ended questions

 

 

作业:清理你研究所需要的变量

5

9月28日

重新构造变量:变量重新分类;连续变量变分类变量;高阶变量构造

 

 

作业:更明确定义你需要的变量

6

9月29日

数据库合并:保留研究所用数据和变量;数据库改变形状:构造子女、父母、照料者数据库

 

 

作业:生成一个包含研究需要变量的数据库;提交研究计划

7

10月12日

研究要素:理论假说;讨论研究计划

 

 

作业:定义你的结果变量(Y)、原因变量(X),并且提出理论假说

8

10月13日

描述两个连续变量之间的关系:scatter plots,lowess graphs;相关系数表。

 

 

作业:疾病与年龄的关系;各种疾病相关关系

9

10月19日

制作二维表格表示分类变量之间的关系,或者分类变量与连续变量之间的关系

 

 

作业:做表表示你的Y与X变量的关系

10

10月20日

描述三个变量之间的关系:画图;制作三维表格

 

 

作业:分性别、城乡表现你的表格

11

10月26日

检验假设:组间均值、分布是否相同

 

 

作业:检验性别之间、城乡之间的Y变量、X变量是否相等,Y*X是否相等

12

10月27日

如何写论文?如何引用文献?学习Note Express

 

 

小论文一:在描述统计的基础上写一篇小论文

13

11月2日

最小二乘法回归基础 - 单变量回归:基础概念;假设检验

 

 

作业:运行Y对X的单变量回归,解释各个统计量的含义,并且检验系数是否为零

14

11月3日

最小二乘法回归基础 – 多变量回归:系数的含义,分类变量用法,交叉项用法和含义

 

 

作业:在Y对X的回归中依次加入性别哑变量,性别与X的交叉项,解释各个系数的含义

15

11月9日

回归模型变种:probit,ordered probit,mlogit (?)

 

 

作业:做出你研究所需要的回归模型,写一段文字描述模型构造、变量含义、回归结果

16

11月10日

缺失变量的识别和处理:制作数据库制作过程表;imputation

 

 

作业:制作与你研究相关的数据库生成过程表,impute除X以外的控制变量,重新做回归模型;修改描写你的回归模型和结果的文字。

 

11月16日

开始写期末论文(经济学年会,不上课)

17

11月17日

解释回归结果:什么是因果关系?如何写文章的介绍、总结、摘要

18

11月23日

判别作用渠道 – 分步加入渠道变量

 

 

作业:练习在你的研究中加入渠道变量,并且写一段文字进行表述。

19

11月24日

处理内生性的方法概述:IV;DID

 

 

作业:试着寻找一个工具变量,做二阶段回归。DID练习

20

11月30日

如何自动生成表格?如何组织研究结果?

 

 

作业:提交自动生成的excel表格、stata codes

21

12月1日

权重的概念,统计量加权

 

 

作业:将你的描述性统计表格做加权处理

22

12月7日

Panel data处理介绍

23

12月8日

分组报告论文;老师点评

24

12月14日

分组报告论文;老师点评

25

12月15日

分组报告论文;老师点评

26

12月21日

分组报告论文;老师点评

28

12月22日