民調資料是厚數據?

厚數據是一種數據?原來大陸學者把民調資料和非結構性資料稱作厚數據了。thick data跟big data一樣,一開始是個空泛的字眼,各路人馬都在搶佔它的定義。現在,thick data這個詞不只有人類學的定義,以及我倡議中的方法論的定義,現在大陸學界也在追上這個流行了。對於民調業者來說,若有人成功地將民調數據等同於厚數據的這種論述成功了,植入大數據人的腦海中,那麼將猶如天降甘霖。不過,我認為:即使是小數據也不見得能輕易冠上一個新名詞叫作厚數據。民調資料要稱作厚數據,還有一段路要走。我們不該,也不必以找到「那一種數據可以稱作厚數據」作為滿足。我們追求的,是找到一種方法論立場「讓大數據也成為厚數據」以及「讓研究者將注意力從一般數據和資料的描述與預測轉為對手邊資料意義的挖掘」。


大数据"牵手"厚数据,解读社会现象有一套

浙江大学举办"大数据与厚数据发展前瞻"高端研讨会

发布时间:2017-03-13来源:浙大新闻办作者:周亦颖 周立超浏览次数:781 .





"通过线上大数据研究,确定制假贩假窝点的经纬度。通过‘密探’对重点区域、市场的走访,得到不同假货市场的不同特征,发现中国假货市场的现状。"

312日上午,在浙江大学举办的"大数据与厚数据发展前瞻"高端研讨会上,阿里巴巴安全部总监连斌用打假的生动案例,让大数据和厚数据顺利"牵手",深度解读社会现状。

这场研讨会还吸引了来自清华大学、北京大学、复旦大学和暨南大学的长江特聘教授、知名学者,他们立足各自研究领域,表达了对大数据和厚数据的发展期望。

"如果说大数据是基于严格的统计理论产生的结构化数据,那么厚数据就是一种非结构化的数据,是人类活动的数字化记录。"清华大学社会科学学院党委书记、经济学研究所所长刘涛雄在解读大数据与厚数据之间的关系时指出,两类数据的结合,能够帮助决策者更好地选择手段、预测效果。

正如它的名字一样,厚数据的特点在于"厚",主要通过抽样调查,揭示数据与数据之间的因果关系,将研究推向纵深。以浙江大学社会科学研究基础平台主任甘犁的《电商对农村农户的影响》课题为例,在淘宝提供的大数据的基础上,研究者们通过抽样调查农村用户的收益、就业等厚数据,发现农村电商发展正在往中西部辐射。有了农村电商,农民的"钱袋子"鼓起来了,家庭创业多起来了,留守之痛也被逐渐缓解。

"目前,中国比较缺乏基础数据。将抽样调查‘厚’数据与田野或实验室的‘小’数据、互联网‘大’数据结合起来,能够很好地捕捉社会变化,推动中国社会科学研究。"甘犁说。

浙江大学副校长罗卫东表示,希望通过本次研讨会为未来人文社会科学研究和学科发展的转型升级进一步拓展思路,为浙江大学更好地把握时代脉搏、发挥综合优势提供一些有益的指导建议和前瞻性的思考启发。

    (文 周亦颖/摄影 周立超)