彩虹总在风雨后——朝阳区CDC一组实践学生报道

 发布时间:2018-08-14

  本周,朝阳一组回收了所有调查问卷,共计676份,其中含9份无效问卷,问卷有效率99%。小组成员将所有问卷录入数据库,并由骆洪梅同学将数据库合并,导出EXCEL文件。网络发放的调查问卷共收回499份有效问卷。本周的主要任务为数据预处理与数据分析。 

  首先我们进行数据清洗。姜晓红老师为我们讲解了数据清洗的相关知识,并指导我们拟定了数据清洗方法与要求。我们根据问卷的题目及选项,在数据库中逐一筛选,找出不符合条件的问卷编号,然后找到相对应的纸质问卷,查看是否录入错误。若录入错误,则进行修改;若问卷填写有误,则暂保留该条数据,并做标记,以便后续查询。最后我们对无效问卷(某问题对应一个答案,调查对象回答时多选)做处理,并录入Epidata数据库,合并数据库。 

 

  面对庞大的数据库,我们感觉无从下手,不知如何分析。姜晓红老师、王丽娟老师给了我们很多宝贵的思路,我们结合所查阅的文献资料,对HPV疫苗认知程度相关问题的答案进行赋值,并制定得分标准,将数据转换后进行分析。经过无数个挑灯夜战,小组的数据分析初见成果。通过问卷星回收的问卷数据已整理,并发给指导老师;纸质问卷数据已完成基本人口学特征分析、医务人员不同专业方向对HPV疫苗认知得分差异分析及对HPV疫苗接受度的影响因素分析。我们将分析结果汇总整理,并汇总在最终的专题调查报告中。   

  通过专题实践,我们学到了很多书本以外的知识和理论知识的应用方法。在数据清洗过程中,我们最大的感受是理论知识到实践应用的能力欠缺。数据清洗的相关理论知识已在统计课上学过,但当我们面对收回来的原始数据库时,仍不知该如何从众多数据中整合有效数据,得出有价值、有意义的结论。好在,指导老师给了我们很多帮助,我们也查阅文献,集思广益,展开头脑风暴,一起商讨解决办法。在讨论过程中,也增进了我们的同学情谊。 

  (舒刘梅)