【摘要】实证研究已经成为社会学的一个重要研究取向,变量的选择是实证研究重要的一个环节。但在实际中许多人更多的从结果出发,根据统计指标进行选择,或没有依据的随意选择。对于这个问题,本文认为要摆脱以统计模型为基础而选择变量的错误做法,仅仅将其作为一种考量变量选择的一种方法;要重视理论对于变量选择的作用,要有理论的支撑,在理论的指导下慎重选取;当然,我们也不能脱离了我们的现实社会,我们研究问题以及变量的选取上要有一定的社会价值,不能仅就理论和数据远离现实的空谈。也只有这样,我们所做的研究才真正的具有意义。
【关键词】统计指标;理论;现实;价值
在实际的教学过程中,经常发现这样的情况:学生在实证的论文中追求解释变量对被解释变量的显著性,并指出其模型如何如何之好以及预测的可靠性等。其实当看完这篇文章之后,并没有获得任何新的东西,因为就相关结果早就被许许多多的学者所证实,我所思考的是该如何选取研究变量才使得我们的研究更有意义和价值,以下本文就从笔者自己的理解来分析这个问题。自孔德将社会学和实证结合起来并经过包括涂尔干在内的众多学者的完善和发展之后,实证主义已经成为社会学的一个重要研究取向,并且在相当长的时间内处于主导地位。不管怎么说,作为一种研究范式,实证研究已经成为我们社会学专业学生的一个重要的研究方向。但是我们在日常研究中却常常滥用这个方法,不遵守社会学研究的一般顺序,更多的是从数据出发来研究相关问题,更加关注的是统计方法的各种指标,并通过这些统计指标来进行变量的选取。其实,就统计指标来说,每个统计指标都相应的存在一些问题,也都不是绝对的,那么如果我们从统计模型的各种指标出发来选择相关变量并使这些变量满足统计指标必然会造成研究的误差甚至错误。因而如何合理的选择研究变量对研究的有效性就显得十分必要。
一、相关变量的选择
(一)从问题出发选取被解释变量
就被解释变量来说,其来自于我们所要研究的问题,一个好的被解释变量源自于一个好的问题。在彭玉生《洋八股与社会科学规范》一文中也对研究的问题进行了系统的描述,并提到了一个好的问题的几个参考标准:具体;集中;原创性以及意义,在此我也不做过多的说明。当然,问题也不能和被解释变量直接划等号,其中间还有一个操作化的过程。比如倪志伟在1989年发表论文中在论证我国由再分配向市场转型导致有利于直接生产者的权利转移这个问题时,而是借助于理论分析将这种权利的转移与其在市场中所获得的经济收益联系起来,以经济收益作为被解释变量。因此,我们在选取被解释变量的时候首先要从问题出发,当不能直接选取被解释变量的时候,我们就要借助于理论梳理,用与之相关的并能够恰当的说明问题的变量进行研究。
(二)以理论指导选取解释变量
相对于被解释变量来说,解释变量的选择或许才是我们经常出现问题并更要加以关注的地方,它是我们结论的来源,也是我们研究中所要创新的地方。尽管对于相同的问题有不同的研究者进行研究,但由于在解释变量选取上的不同,也很可能出现巨大的差异甚至是相反的结论。并且很多学者对于统计方法的盲目崇拜,根据模型的统计指标的变化来对解释变量进行选择,从而忽视了变量之间的因果顺序和逻辑联系。既然如此,那么我们应该如何去合理的选择自变量也就是解释变量呢。我们在对某一个问题并运用实证的方法来研究时,我们更多的并不是直接的从问题全部本身进行研究,而更可能的是关注其中的几点提出自己的假设并进行验证。对于重要的解释变量的选择依赖于假设的提出,也就是说我们想要如何去研究我们所要研究的问题。那么这样的话,我们的问题就变成了:我们该如何形成我们的研究假设并进而选择解释变量。对于假设,其是研究将要验证的经验命题,假设的提出必须从现有的理论或文献、彼此竞争的理论或文献,或学者自己创新的理论中演绎而来。如果我们脱离了理论或文献资料而凭空或自己的经验建立假设,那么这样的研究是缺少知识的积累的,没有很大的实际价值。建立在理论基础上的假设将会使得我们选择变量更有目的性和有效性。此外,理论的指导可以帮助我们理清变量之间的逻辑关系。我们在日常的具体研究中,尤其是我们社会学,更多的面临的是横截面的数据,那么其中部分变量之间的前后关系就变得不明显,我们也不好把握其因果逻辑,以至于有时候在选择解释变量时会出现因果倒置的现象。比如我们经常所使用的社会网络资本的概念,在求职中是由于社会资本的丰富而寻找到了较高的职位呢还是因为获得了较高的职位导致了其社会网络资本的增加呢,我们并不能很好的进行识别。就这一方面我们就要深入的对社会资本理论以及地位获取模型进行详细的了解,并研究之前的研究者在处理社会资本与职业获取方面所进行的尝试。只有在理论的指导下我们才可能对那些模糊的变量关系做出恰当的处理。
(三)以先前理论以及前人的研究选取控制变量
当然,我们也不能忘记另一方面,即控制变量并不作为解释变量存在,其也不依赖于假设的提出。对于这些自变量,我们也不能随意的提出,理论的背景也是其提出的核心。尽管控制变量不对被解释变量进行解释,但是其也对被解释变量产生很重要的影响。比如我们要研究教育水平对个人收入的影响,我们从之前的文献以及相关理论等发现不同宗教(尤其在国外)对个人收入也产生很显著的影响,那么对宗教进行控制就显得非常必要的。但不管如何,先前理论以及前人的研究是我们选择控制变量的基础。
二、通过模型启发变量的选择
我们在上面提到我们不能通过模型的统计指数来反过来选择变量,但是作为一种方法的存在,我们也应该利用这一方法为我们选择变量服务。如果我们在某两个或几个具有很强共线性的变量进行选择上陷入迷茫,也就是说在理论上不好进行区分的话,在这个时候运用模型检验不同变量的优劣是一个不错的选择。这样在保证恰当解决问题的前提下也获得了更好的拟合优度。其次,我们也可以在之前理论和文献的基础上建立一定的基准模型,然后再加入适当的但之前很少用的变量进行尝试,我们可以根据前后各项统计指标的变化来确定某一新加入变量对基准模型的改变,这可能在一定的情况下给予我们一定的启发,甚至取得理论上的创新和突破。例如,我们在研究居民收入的影响模型时,在偶然的情况下我们加入了社会资本的相关变量,在嵌套模型中发现加入社会资本相关变量之后模型的解释力得到了很高的提升,那么在这种情况下就会促使我们进行思考,并可能导致新的理论的产生。
三、变量的选择更加关注现实社会
尽管理论的指导在我们选择变量的过程中至关重要,并且统计的方法本身也会为我们提供相关的协助,但是我们也不要忘记我们的使命。我个人觉得,作为社会学的学生以及学者都应该具有一定的社会责任感,也要关注现实的社会。也就是说,我们所研究的问题或变量的选择要有一定的现实意义。或许米尔斯在批判帕森斯的宏大理论以及抽象经验主义并要求我们拥有的那种社会学的想象力也是基于这种考量吧。那么就这一方面来看,我们在选择变量尤其是被解释变量的时候就要更多的关心社会现实,增加个人的社会阅历,了解社会中的问题之所在并对此进行解决。同样在解释变量的选取上,我们也要源于现实,正如韦伯所告诫我们的那样只有通过个人直接的生活“体验”和主体移情式的“理解”,才能领悟到作为生命体现的人类文化的历史的真谛。只有我们理解不同的解释变量在具体的现实生活中的构成、相互互动的关系以及作用机制,我们才可能更加契合的理解我们所要研究的问题。其实,就在研究变量如何选取的问题上,我们要摆脱以统计模型为基础而选择变量的错误做法,仅仅将其作为一种考量变量选择的一种方法;要重视理论对于变量选择的作用,不管是被解释变量还是解释变量,我们在选取的时候一定要有理论的支撑,在理论的指导下慎重选取;当然,我们也不能脱离了我们的现实社会,我们研究问题以及变量的选取上要有一定的社会价值,不能仅就理论和数据远离现实的空谈,也只有这样,我们所做的研究才真正的具有意义。
参考文献:
[1]赵松山.对拟合优度R2的影响因素分析与评价.东北财经大学学报,2003.3.
[2]齐晓丽,梁慧超,冯彦妍.回归模型构建中变量选择的研究.河北工业大学学报,2009.6.
[3]白雪梅,赵松山.关于自相关若干问题的研究.现代经济,2002.11.
[4]彭玉生.“洋八股”与社会科学规范.社会学研究,2010.2.
[5]VictorNee,Atheoryofmarkettransition:Fromredistributiontomarketsinstatesocialism.AmericanSociologicalReview,1989,vol.54.
[6]C•赖特•米尔斯.社会学的想象力.陈强,张永强译.生活•读书•新知三联书店,2001.
[7]马克思•韦伯.社会科学方法论.韩水法译.中央编译出版社,1999.
作者:訾彦锋