同乡聚居对农民工职业流动的影响:基于空间错配视角

刘启超

刘启超. 同乡聚居对农民工职业流动的影响:基于空间错配视角[J]. 电子科技大学学报(社科版), 2025, 27(3): 1-16.. DOI: 10.14071/j.1008-8105(2025)-5017
引用本文: 刘启超. 同乡聚居对农民工职业流动的影响:基于空间错配视角[J]. 电子科技大学学报(社科版), 2025, 27(3): 1-16.. DOI: 10.14071/j.1008-8105(2025)-5017
LIU Qi-chao. The Effect of Homeplace-Based Settlement on the Occupational Mobility of Rural-Urban Migrants: From the Perspective of Spatial Mismatch[J]. Journal of University of Electronic Science and Technology of China(SOCIAL SCIENCES EDITION). DOI: 10.14071/j.1008-8105(2025)-5017
Citation: LIU Qi-chao. The Effect of Homeplace-Based Settlement on the Occupational Mobility of Rural-Urban Migrants: From the Perspective of Spatial Mismatch[J]. Journal of University of Electronic Science and Technology of China(SOCIAL SCIENCES EDITION). DOI: 10.14071/j.1008-8105(2025)-5017

同乡聚居对农民工职业流动的影响:基于空间错配视角

基金项目: 

国家自然科学基金青年项目(72404168).

详细信息
    作者简介:

    刘启超,中国社会科学院财经战略研究院助理研究员

  • 中图分类号: F249.21

The Effect of Homeplace-Based Settlement on the Occupational Mobility of Rural-Urban Migrants: From the Perspective of Spatial Mismatch

  • 摘要:

    通过构建同乡聚居选择内生化的空间错配模型,本文理论层面研究了同乡聚居选择影响农民工职业流动的机理。在理论分析基础之上,本文使用中国乡城人口流动数据与采用Probit模型进行了实证检验。研究发现,选择与同乡聚居不利于农民工的职业向上流动。在利用异方差工具变量法处理了模型中潜在的内生性问题,以及采用倾向得分匹配和遵循Heckman处理效应模型解决了样本选择性偏误问题之后,该结论依然稳健。基于空间错配视角的进一步研究发现,居住空间隔离所导致的社会空间隔离,是同乡聚居不利于农民工职业向上流动的重要原因。研究意味着,应正确认识同乡聚居在农民工职业发展中的作用,促进农民工与本地人社会互动以降低空间错配产生的影响。

    Abstract:

    Homeplace-based settlement model is developed to analyse the mechanism of the homeplace-based settlement on the occupational mobility of rural-urban migrants. On the basis of theoretical analysis, empirical tests are conducted using the data of Rural-Urban Migration in China and Probit model. It is found that choosing to live with their fellow townsman is not conducive to the occupation upward mobility of rural-urban migrants. After using heteroskedasticity-based instruments to address potential endogeneity issues in the model, as well as using propensity score matching and following Heckman treatment effects model to solve the problem of sample selection bias, the conclusion remains robust. Further research finds that the social spatial isolation caused by residential spatial isolation is an important reason for the above negative effects. Research reveals that we should have a correct understanding of the role of homeplace-based settlement in the career development of rural-urban migrants, promote social interaction between rural-urban migrants and locals to reduce the impact of spatial mismatch.

  • 实现全体人民共同富裕是社会主义的本质要求,是中国式现代化的重要特征。党的二十届三中全会指出,要聚焦提高人民生活品质、推动人的全面发展、使全体人民共同富裕取得更为明显的实质性进展。《中华人民共和国经济和社会发展第十四个五年规划和2035年远景目标纲要》也提出,到2035年,“全体人民共同富裕取得更为明显的实质性进展”。要实现上述目标,就不能不重点关注农民工及其职业纵向流动,因为农民工职业向上流动性不足,势必影响到共同富裕的实现[1]。一方面,共同富裕意味着“人人都要向上”。作为中等收入的重要潜在群体,能否有更多农民工进入中等收入群体行列,直接检验着共同富裕的实现程度[2]。另一方面,完整的农民工流动是指在横向流动扩大的过程中实现职业等的纵向向上流动,但农民工目前的流动主要表现为乡城间的横向流动,而职业和收入等纵向流动尚未充分展开[3]。因而,研究影响农民工职业向上流动的因素及其机制,对于实现全体人民的共同富裕具有重大现实意义。

    职业流动(occupational mobility)指个体职业的转变过程,依流动方向可分为水平流动和纵向流动。在有关职业流动的研究中,国外学者大多聚焦于代际职业流动,揭示影响职业流动的影响因素或规律[4],并讨论职业流动对微观个体及宏观经济社会产生的影响[5]。近年来,伴随着户籍制度的改革,农民工在地理空间流动性增强的同时,实现职业向上流动的渠道也在不断扩宽,国内学者敏锐地捕捉到这一独特的趋势。在借鉴和参考国外的相关理论与方法的基础上,国内学者对农民工职业流动的测度、影响因素展开了初步研究。对于农民工职业流动的测度,目前最有代表性的研究有两类:多数文献基于就业稳定性,将职业流动等同于农民工职业的流动次数和频率等工作转换行为,另有少数文献认为职业流动是指农民工的职业由低级向高级转换的过程[6~7]。相较于职业流动的界定,对农民工职业流动机制的研究更具现实意义。现有研究多认为农民工的人力资本[8]、就业类型[9]、户籍制度[10]和所拥有的社会资源[11]等因素会影响到农民工的职业流动状况。此外,也有研究认为农民工的职业流动频次和方向存在代际差异[12]。现有研究虽从多个角度探讨了农民工职业流动的影响因素,但鲜有从同乡聚居或居住隔离角度进行探讨。从空间错配理论研究个体在劳动力市场上的表现,是目前文献的一个前沿热点。比如,基于空间错配理论视角,可以检验用居住和就业市场之间距离所测量的就业可及性与用就业和收入所衡量的劳动力市场表现之间的关系,并从新古典主义框架和搜寻−匹配模型等多视角探讨空间错配所产生的机制[13]。同时,该理论也为将同乡聚居与职业流动纳入到统一研究框架提供了契机。因而,本文尝试基于空间错配理论,从同乡聚居或居住隔离视角研究农民工职业流动的机理。

    与现有文献相比,本文可能的边际贡献如下:(1)构建社会空间内生化的空间错配模型,从理论层面揭示了同乡聚居选择影响农民工职业流动的机理;(2)基于中国乡城流动人口数据,采用Probit模型和异方差工具变量法等多种计量方法,实现了同乡聚居选择对农民职业流动的因果识别,丰富了相关领域的研究;(3)从空间错配视角,探讨农民工在横向流动过程中的典型特征对自身纵向流动的影响,有助于更好地理解农民工流动及其在共同富裕道路中的作用,把握共同富裕的着力点。

    国内外的相关文献业已表明,城市外来移民或低收入群体基于种族、肤色或地缘的空间聚居或居住隔离现象是普遍存在的[14]。上述因族裔或种族聚集所形成空间聚居,对社区内个体的就业机会、职业发展等产生了重要影响[15]。在理论层面,Kain是较早将居住和就业机会的空间差异联系起来,阐述低收入群体的居住空间隔离对其劳动力市场表现,并据此首先提出了空间错配假说(Spatial Mismatch Hypothesis)[16]。该理论认为,居住隔离所导致的就业地与居住地的分离,使城市中低收入者与高质量岗位之间面临较强的空间障碍,从而造成低收入群体在劳动力市场上具有较差的表现[17]。由于美国种族问题的历史原因,非洲裔黑人成为了早期空间错配的主要研究群体,进一步的研究则发现不仅非裔黑人,西班牙裔和拉丁裔工人甚至白人在居住隔离的情形下同样也面临着就业脆弱性[18]。在最新的研究中,移民、低技能或低收入群体、刚入职工人、新释放的监狱人员等其他弱势群体也被作为研究对象进行分析 [13]。比如,低收入更倾向于借助非正式的邻里社会网络搜寻工作,当聚居区内失业率较高时,则就业信息的可达性就是较低,也即因种族或地缘所形成的居住隔离影响了聚居区内低收入者的就业机会[19]。即使居住隔离短期有助于低收入群体找到工作,但长期也将其锁定在了该区域,影响了其职业期望和发展[20]。同时,聚居也会通过邻里效应影响到子代的大学入学率及成年后的收入,而减少居住隔离、增加社会资本则能够有效提高代际流动性[21]

    不同于欧美国家城市主要因种族、肤色形成的空间聚居,中国城市内部不同群体的聚居空间隔离,则更多为外来人口与本地居民之间的居住空间隔离[22~24]。研究表明,地理上的邻近有利于信息的共享和传播,故同乡聚居有助于初进城农民工利用同乡关系网络弥补自身人力资本和城市社会资本的不足,从而有益于实现就业[25]。但是,由于职业在不同社会阶层之间的隔离和信息不对称的空间聚类特征,社会网络所提供多是低技能或低收入岗位。也有文献基于空间错配理论,分析居住隔离或同乡聚居对农民工在劳动力市场上表现的影响。比如,Bi 等以云南省2015年农民工城市住户监测调查的截面数据为基础,考察了空间错配和飞地效应对农民工个人就业和家庭收入的影响;研究结果表明,通勤时间对农民工的就业倾向没有显着影响,但对农民工的家庭收入却有显着的负面影响,农民工个体交往的亲友数量对其就业倾向和收入也有显着的积极影响[26]。Zhu的研究则发现,农民工在城镇周边的居住隔离所带来的就业结果是积极的,因为其就业溢出效应大于空间错配所带来的不利影响[27]。从社会空间角度看,同乡聚居所造成的社会空间隔离,造成聚居区内农民工的社会互动对象多为以亲缘、地缘等为纽带的先赋性社会网络,无法有效地建构以业缘、趣缘等为纽带的自致性社会网络,以及无法分享与本地居民互动时所产生的人力资本外部性,进而造成农民工城市融入意愿和人力资本不足[28]。以上同乡聚居所造成的“内卷化”影响,会阻碍农民工的人力资本提升与职业发展,使其固定在低技能和低收入岗位上,最终导致社会不平等的延续[29]。一方面,对于选择与同乡聚居的农民工,其日常接触到的多为以亲缘、地缘为纽带的强关系,不利于其跳出原有的乡土社会关系网络,构建以业缘、趣缘等为纽带的新型社会关系网络。另一方面,选择同乡聚居会对农民工的职业流动产生负面影响。具体而言,地理空间障碍的存在,会导致同乡聚居区内的农民工较少与弱关系进行社会互动,使其无法借助新型社会网络的信息桥来获取高质量工作信息的机会,从而造成自身职业向上流动性较差。

    以往有关空间错配的理论模型,多从工作搜寻和工作可及性角度来阐释空间错配产生的机制,比如搜寻成本、就业信息获取和劳动力与住房市场歧视等。基于弱关系优势理论,Zenou[20]将社会空间引入到空间错配模型,解释了通勤距离对劳动力失业率的影响。鉴于城乡二元户籍制度的存在,本文借鉴上述模型的思路并结合研究对象对该模型作进一步扩展,即放松模型假设,将同乡聚居选择内生化。具体而言,同乡聚居不仅会增加农民工的通勤距离,还会造成农民工移植、复制以血缘、地缘等为纽带的先赋性社会网络,不利于其与以业缘、趣缘等为纽带的弱关系进行互动而构建自致性社会网络。因而,扩展后的模型从居住空间与社会空间隔离角度,解释了同乡聚居影响农民工职业流动的机制。

    假设个体属于一个二人组,或者称为二元圈子(Dyads)。圈子内为家庭成员、亲戚等强关系或先赋性社会网络,且一旦形成不会轻易破裂。圈子外为同事、熟人等弱关系或自致性社会网络。在劳动力市场上,以初职为参照标准,个体的职业状态可能为实现向上流动或向下流动。因此,圈子中的成员在t时刻的职业流动状态可能为:二者均为职业向上流动者,圈子数量为$ {Q}_{2}\left(t\right) $;一个实现职业向上流动,一个实现职业向下流动,圈子数量为$ {Q}_{1}\left(t\right) $;二者均为职业向下流动者,圈子数量为$ {Q}_{0}\left(t\right) $。若把总人口标准化为1,则t时刻的实现职业向上流动者所占的比率$ e\left(t\right) $和实现职业向下流动者所占的比率$ u\left(t\right) $分别为

    $$ e\left(t\right)=2{Q}_{2}\left(t\right)+{Q}_{1}\left(t\right),u\left(t\right)=2{Q}_{0}\left(t\right)+{Q}_{1}\left(t\right)$$ (1)

    即实现职业向上流动的人口比例等于属于圈子$ {Q}_{2}\left(t\right) $与圈子$ {Q}_{1}\left(t\right) $的人数之和比上总人口,实现职业向下流动的人口比例等于属于圈子$ {Q}_{0}\left(t\right) $与圈子$ {Q}_{1}\left(t\right) $的人数之和比上总人口。

    假设时间连续且个体永久存活,群体中的个体随机成对重复匹配而进行互动,且互动对象不限于圈内成员。在$ t $时刻,当个体随机匹配到圈子外个体或弱关系的概率为$ \omega \left(t\right) $,匹配到圈子内个体或强关系的概率为$ 1-\omega \left(t\right) $。此外,个体需要获得比初职较好或高质量的工作信息,方能实现职业的向上流动。令高质量工作的信息,只能由已实现职业向上流动的个体传递给未实现职业向上流动的个体。此假设是合理的,因为若职业向下流动者获得高质量的工作信息会自己使用,而非传递给他人。假设实现职业向上流动的个体通过社会网络途径获取工作信息的概率为$ \lambda $,以及变为职业向下流动的概率为$ \mathrm{\delta } $。该假设也比较符合理论研究,根据弱关系优势理论,从强关系中获得的多为重复、无效的低质量信息。对于农民工而言,其进城前所形成的强关系多是基于亲缘、血缘等关系建立起来的,具有乡土性、趋同性和低异质性等特征。与此相反,农民工进城后基于业缘和更大范围内的地缘所形成的新型社会网络或弱关系,有助于农民工克服劳动力市场上信息不对称,最终有利于农民工实现高质量就业。

    为了不失一般性,这里只讨论处于圈子$ {Q}_{1}\left(t\right) $内个体通过社会关系网络实现职业向上流动的概率。此时,圈子$ {Q}_{1}\left(t\right) $内个体通过弱关系实现职业向上流动的概率为$ \omega \left(t\right)e\left(t\right)\lambda $,通过强关系实现职业向上流动的概率为$ \left[1-\omega \left(t\right)\right]\lambda $此外,若信息传递(information transmission)的过程遵循马尔科夫过程(markov process),其中的状态变量(state variable)为各个类型圈子的相对规模变化量,故在较小时间间隔$ t $到$ t+\varDelta t $内,同个圈子内两个成员同时改变状态的概率为0。可得,在较小时间间隔$ t $到$ t+\varDelta t $内:圈子$ {Q}_{0}\left(t\right) $的净流量$ {N}_{0}\left(t\right) $等于圈子$ {Q}_{1}\left(t\right) $转变为圈子$ {Q}_{0}\left(t\right) $的数量,减去圈子$ {Q}_{0}\left(t\right) $转变为圈子$ {Q}_{1}\left(t\right) $的数量,即

    $$ {N}_{0}\left(t\right)=\delta {Q}_{1}\left(t\right)2\omega e\left(t\right)\lambda {Q}_{0}\left(t\right)$$ (2)

    其中,$ \delta $表示圈子$ {Q}_{1}\left(t\right) $内原职业向上流动者变为职业向下流动的概率,$ \omega e\left(t\right)\lambda $表示$ {Q}_{0}\left(t\right) $内职业向下流动者通过弱关系实现职业向上流动的概率。

    类似地,圈子$ {Q}_{1}\left(t\right) $的净流量$ {N}_{1}\left(t\right) $等于圈子$ {Q}_{0}\left(t\right) $和圈子$ {Q}_{2}\left(t\right) $转变为圈子$ {Q}_{1}\left(t\right) $的数量,减去圈子$ {Q}_{1}\left(t\right) $转变为圈子$ {Q}_{0}\left(t\right) $和圈子$ {Q}_{2}\left(t\right) $的数量,即

    $$ {N}_{1}\left(t\right)=2\omega e\left(t\right)\lambda {Q}_{0}\left(t\right)\left[\delta +\lambda -\omega \lambda +\omega \lambda e\left(t\right)\right]{Q}_{1}\left(t\right)+2\delta {Q}_{2}\left(t\right)$$ (3)

    其中,$ \omega e\left(t\right)\lambda $表示圈子$ {Q}_{0}\left(t\right) $内实现职业向下流动者通过弱关系实现职业向上流动的概率,$ [\delta +\lambda - \omega \lambda +\omega \lambda e\left(t\right)] $表示圈子$ {Q}_{1}\left(t\right) $内职业向上流动者变为职业向下流动或职业向下流动者实现职业向上流动的概率,$ 2\delta $表示圈子$ {Q}_{2}\left(t\right) $内职业向上流动者实现职业向下流动的概率。

    圈子$ {Q}_{2}\left(t\right) $的净流量$ {N}_{2}\left(t\right) $等于圈子$ {Q}_{1}\left(t\right) $转变为圈子$ {Q}_{2}\left(t\right) $的数量,减去圈子$ {Q}_{2}\left(t\right) $转变为圈子$ {Q}_{1}\left(t\right) $的数量,即

    $$ {N}_{2}\left(t\right)=\left[1-\omega +\omega e\left(t\right)\right]{\lambda Q}_{1}\left(t\right)-2\delta {Q}_{2}\left(t\right)$$ (4)

    其中,$ \left[1-\omega +\omega e\left(t\right)\right]\lambda $表示圈子$ {Q}_{1}\left(t\right) $内职业向下流动者实现职业向上流动的概率,$ 2\delta $表示圈子$ {Q}_{2}\left(t\right) $内职业向上流动者变为职业向下流动工作的概率。

    若使稳态均衡($ {Q}_{2}^{*} $,$ {Q}_{1}^{*} $,$ {Q}_{0}^{*} $)存在,则需各圈子净流量为0,即式$ {N}_{0}\left(t\right) $、$ {N}_{1}\left(t\right) $、$ {N}_{2}\left(t\right) $均为0。结合式(1)可得均衡条件为

    $$ \frac{\delta }{\lambda } < \frac{\omega +\sqrt{\omega \left(4-3\omega \right)}}{2}$$ (5)

    均衡时,实现职业向上流动个体的占比为

    $$ {e}^{*}\left(\omega \right)=\frac{\sqrt{\lambda \left[\lambda +4\delta \left(1-\omega \right)\right]}-2\delta +2\lambda \omega -\lambda }{2\lambda \omega }$$ (6)

    在上述社会空间模型中,与弱关系进行社会互动是假设外生给定的,接下来对社会空间模型进行扩展,认为由于地理空间因素,与弱关系进行社会互动及建构新型社会网络是需要成本。比如,选择与同乡聚居的农民工日常接触或互动对象多为同乡等强关系,若与弱关系进行社会互动,需付出一定行程成本以走出同乡聚居区。也是因为互动成本的存在,农民工会更倾向于与邻居进行社会互动。在邻居多为强关系的情况下,选择与同乡聚居的农民工则难以获得有助于职业向上流动的工作信息,即所获得的工作信息质量较低。令通过弱关系进行社会互动所付出的成本$ C\left(\omega ,x\right) $,其中$ x $指同乡聚居程度。可知,选择同乡聚农民工的互动成本越高,则与弱关系互动的频次越多和交往程度越深。因而,对于$ \forall x\in \left[0,1\right] $,$ C\left(\omega ,x\right) $满足

    $$ \begin{split} & {C}_{\omega }'\left(\omega ,x\right)=\frac{\partial C\left(\omega ,x\right)}{\partial \omega } > 0,{C}_{x}'\left(\omega ,x\right)=\frac{\partial C\left(\omega ,x\right)}{\partial x} > 0,{C}_{\omega }'\left(0,x\right)=0 \\ & {C}_{\omega x}''\left(\omega ,x\right)=\frac{{\partial }^{2}C\left(\omega ,x\right)}{\partial \omega \partial x} > 0,{C}_{\omega \omega }''\left(\omega ,x\right)=\frac{{\partial }^{2}C\left(\omega ,x\right)}{\partial {\omega }^{2}} > 0 \end{split}$$ (7)

    当式(5)均衡条件满足时,个体的预期效用$ EV\left(\omega ,x\right) $为

    $$ EV\left(\omega ,x\right)={e}^{*}\left(\omega \right)\left(y-sx\right)-C\left(\omega ,x\right)$$ (8)

    其中,$ {e}^{*}\left(\omega \right) $即为均衡时的实现职业向上流动的比率,$ y $为个体收入,$ sx $为租金、水电费等生活成本。

    每一个个体选择最优的$ \omega $,以实现个人预期效用最大化。此时式(8)的一阶条件为

    $$ \frac{\partial {e}^{*}\left(\omega \right)}{\partial \omega }\left(y-sx\right)-{C}_{\omega }^{\text{'}}\left({\omega }^{*},x\right)=0$$ (9)

    进一步可得

    $$ \dfrac{\partial {\omega }^{*}}{\partial x}=\dfrac{s\dfrac{\partial {e}^{*}\left(\omega \right)}{\partial {\omega }^{*}}+{C}_{\omega x}''\left(\omega ,x\right)}{\dfrac{{\partial }^{2}{e}^{*}\left(\omega \right)}{\partial {{\omega }^{*}}^{2}}\left(y-sx\right)-{C}_{{\omega }^{*}{\omega }^{*}}''\left({\omega }^{*},x\right)}$$ (10)

    由于$ \dfrac{\partial {e}^{*}\left(\omega \right)}{\partial {\omega }^{*}} > 0 $,$ {C}_{{\omega }^{*}{\omega }^{*}}''\left({\omega }^{*},x\right) > 0 $,结合式(6)可知,$ \dfrac{{\partial }^{2}{e}^{*}\left(\omega \right)}{\partial {{\omega }^{*}}^{2}} < 0 $。此时,同乡聚居与职业流动的关系为

    $$ \frac{\partial {\omega }^{*}}{\partial x} < 0,\frac{\partial {e}^{*}\left(\omega \right)}{\partial x}=\frac{\partial {e}^{*}\left(\omega \right)}{\partial {\omega }^{*}}\frac{\partial {\omega }^{*}}{\partial x} < 0$$ (11)

    式(11)表明,一方面,对于选择与同乡聚居的农民工,其日常接触到的多为以亲缘、地缘为纽带的强关系,不利于其跳出原有的乡土社会关系网络,构建以业缘、趣缘等为纽带的新型社会关系网络。另一方面,选择同乡聚居会对农民工的职业流动产生负面影响。具体而言,地理空间障碍的存在,会导致同乡聚居区内的农民工较少与弱关系进行社会互动,使其无法借助新型社会网络的信息桥来获取高质量工作信息的机会,从而造成自身职业向上流动性较差。综上,提出本文所要验证的两个研究假说:

    假说1:选择同乡聚居不利于农民工实现职业向上流动。

    假说2:居住空间隔离所导致的社会空间隔离,是同乡聚居降低农民工职业向上流动概率的重要原因。

    本文主要使用中国乡城流动人口数据(Rural-Urban Migration in China,RUMiC)。在已有可获得的微观调查数据中,唯有RUMiC数据同时包含农民工职业(初职和现职)与同乡聚居信息。本文选用其中2016年和2017年的混合截面数据。此外,本文还使用RUMiC2008和RUMiC2009的混合截面数据进行稳健性检验。RUMiC数据是由北京师范大学、澳大利亚国立大学、国家统计局和德国劳动研究所,于2008年在中国9个省份的15个城市进行9年的实地调查。自2017年起,该调查由暨南大学经济与社会研究院独立开展。由于本文的研究对象为农民工,参考国家统计局《2023年农民工监测调查报告》中对农民工的定义,本文只保留了上述数据中为农业户籍、已就业、流动半年以上和年龄在16~65岁的乡城流动人口。在删除有关变量的极端值和缺失值后,共得到7762个农民工样本。

    1. 被解释变量

    在本文中职业向上流动是指农民工职业的社会地位提升,具体为现职的社会地位要高于初值。其中,对于职业所体现的社会地位,本文采用国际社会经济地位指数(International Socio-Economic Index,ISEI)来测度。在具体测算方面,由于RUMiC数据只包含样本进城后的具体职业(即,初职与现职),并未直接给出各样本职业所体现的ISEI。本文根据1988年国际标准职业分类量表(ISCO-88职业编码),手动将具体职业转化为ISCO-88职业编码,然后再将农民工初职与现职的ISCO-88编码依次转换为取值范围16~90分的ISEI。若现职的ISEI值高于初职,则表明发生了向上的职业流动,赋值为1,否则赋值为0,由此得到二分类的客观代际社会流动指标。其中,ISEI根据各种职业的群体社会经济特征,以每个职业的平均收入和教育水平乘以相应的权数,故可客观准确衡量个体的社会地位状况,已被广泛运用于有关地位获得和社会流动的研究[30]

    2. 核心解释变量

    本文采用农民工周围邻居中同乡状况来测度同乡聚居。在RUMiC数据中,具体为“周围是否住着很多同乡?”若农民工回答为“是”则认为农民工选择同乡聚居,赋值为1,否则为0。可知,若农民工的周围邻居主要为同乡,则说明农民工更倾向于选择同乡聚居。以往研究也有采用该变量来测度农民工的同乡聚居状况,比如刘启超和王亚华 [31]

    3. 控制变量

    为减弱因遗漏变量所导致的偏误,参考已有文献,本文还控制了性别、年龄、婚姻状况、受教育水平、身体健康状况和非务农经历等个人特征,家庭同住人口规模、家庭收入、家庭耕地流转状况等家庭特征,劳动力外流状况、与最近中学距离等村庄特征。

    结合本文要验证的研究假说,本文采用Probit模型来进行研究,计量模型的设定如下:

    $$ Pr\left({{\mathrm{occupup}}}_{i}=1|{x}_{i}\right)=\Phi \left({\beta }_{0}+{\beta }_{1}{{\mathrm{neigh}}}_{i}+\varPi {X}_{i}+{\delta }_{c}+{\sigma }_{t}\right)$$ (12)

    其中,下标$ i $表示第$ i $个农民工样本,被解释变量$ {{\mathrm{occupup}}}_{i} $为表征职业流动的指标,$ {{\mathrm{occupup}}}_{i}=1 $表示农民工职业实现向上流动,$ {{\mathrm{occupup}}}_{i}=0 $表示农民工职业未实现向上流动,即实现水平和向下流动。模型中核心解释变量$ {{\mathrm{neigh}}}_{i} $为衡量农民工同乡聚居的指标,$ {\beta }_{1} $为相应的估计系数,可知其应为负。$ {X}_{i} $是农民工个人、家庭和村庄等一系列特征变量,$ \Pi $是相应的回归系数矩阵。$ {\sigma }_{t} $为年份虚拟变量,用来控制不可观测的时间因素所产生的影响。$ {\delta }_{c} $为城市虚拟变量,用来控制城市不可观测因素所产生的影响。

    本文的主要变量的描述性统计特征见表1。从表1的均值差异检验结果可以看出,相比于选择与同乡聚居的农民工,选择与非同乡聚居的农民工实现职业向上流动的概率更大,本文接下来将对均值差异检验的结论做进一步的因果识别。

    表  1  主要变量的描述性统计特征
    变量名称 变量具体含义 总样本 非同乡聚居 同乡聚居 均值差异检验
    职业流动方向 虚拟变量,向上=1,向下或水平=0 0.650 0.666 0.592 0.074***
    同乡聚居 周围住着很多同乡,虚拟变量,是=1,否=0 0.207 0.000 1.000
    性别 虚拟变量,男=1,女=0 0.562 0.558 0.576 −0.018
    年龄 个人年龄(岁) 36.764 36.736 36.869 −0.133
    婚姻状况 虚拟变量,已婚=1,未婚=0 0.775 0.771 0.788 −0.017
    受教育水平 个人受正规教育年限(年) 8.904 8.982 8.608 0.374***
    身体健康状况 虚拟变量,好=1,不好=0 0.819 0.827 0.789 0.038***
    非务农经历 进城前有非农工作经历,虚拟变量,有= 1,无=0 0.036 0.035 0.041 −0.006
    家庭同住人口规模 目前共同生活的家庭成员人数(人) 2.453 2.491 2.308 0.183***
    家庭收入 家庭收入(元),取对数 8.624 8.615 8.655 −0.040
    家庭耕地流转状况 虚拟变量,转给别人或村集体代耕=1,其他=0 0.331 0.331 0.329 0.002
    劳动力外流状况 老家所在村劳动力外出务工经商的比例 0.618 0.615 0.632 −0.017**
    与最近中学距离 老家所在村距最近寄宿初中的距离(公里),取对数 1.788 1.808 1.710 0.098***
    观测值 7762 6153 1609
    注:均值差异检验指变量在“非同乡聚居”样本组与“同乡聚居”样本组之间的均值差异检验。
    下载: 导出CSV 
    | 显示表格

    根据本文所构建的计量模型进行Probit估计,从表2的估计结果可以看出,在控制其他因素条件下,无论是否控制城市固定效应或时间固定效应,同乡聚居的估计系数(边际效应值)均显著为负,这表明选择与同乡聚居不利于农民工职业的向上流动,从而验证了本文提出的第一个研究假说。结合理论模型,可能的解释是,居住空间隔离所导致的社会空间隔离,不利于农民工建构以业缘、趣缘等为纽带的自致性社会网络,使农民工无法借助弱关系的信息桥来获取高质量工作的机会,从而造成自身职业向上流动性较差。

    表  2  基准回归结果
    变量 (1) (2) (3) (4) (5)
    同乡聚居 −0.070*** −0.053*** −0.030** −0.059*** −0.035***
    (0.013) (0.013) (0.013) (0.013) (0.013)
    性别 −0.028** −0.027** −0.027** −0.025** −0.024**
    (0.011) (0.011) (0.011) (0.011) (0.011)
    年龄 0.002*** 0.003*** 0.003*** 0.003*** 0.003***
    (0.001) (0.001) (0.001) (0.001) (0.001)
    婚姻状况 0. 042** −0.049*** −0.046*** −0.045*** −0.042**
    (0.016) (0.017) (0.017) (0.017) (0.017)
    受教育水平 0.004* 0.005*** 0.005*** 0.005** 0.005***
    (0.002) (0.002) (0.002) (0.002) (0.002)
    身体健康状况 0.024* 0.013 −0.009 0.027* 0.004
    (0.014) (0.014) (0.014) (0.014) (0.014)
    非务农经历 −0.108*** −0.090*** −0.069** −0.092*** −0.071**
    (0.029) (0.028) (0.028) (0.028) (0.028)
    家庭同住人口规模 0.075*** 0.063*** 0.079*** 0.067***
    (0.005) (0.005) (0.005) (0.005)
    家庭收入 −0.014** −0.004 −0.013** −0.004
    (0.005) (0.005) (0.005) (0.005)
    家庭耕地流转状况 −0.027** −0.025** −0.026** −0.025**
    (0.012) (0.012) (0.012) (0.011)
    劳动力外流状况 −0.054** −0.056** −0.036 −0.042*
    (0.023) (0.024) (0.023) (0.024)
    与最近中学距离 0.010 −0.002 0.011* −0.002
    (0.006) (0.006) (0.006) (0.006)
    城市固定效应 未控制 未控制 已控制 未控制 已控制
    年份固定效应 未控制 未控制 未控制 已控制 已控制
    N 7762 7762 7762 7762 7762
    pseudo R2 0.008 0.036 0.054 0.041 0.059
    注:括号中为采用德尔塔方法(Delta method)计算出的标准误;估计系数为边际效应;*、**、***分别表示在10%、5%、1%水平上显著。下同。
    下载: 导出CSV 
    | 显示表格

    同时从表2第(5)列还可以看出,在个人特征方面,年龄、受教育水平等均会显著正向影响农民工职业向上流动的概率,性别、婚姻状况、非务农经历等会显著负向影响农民工职业向上流动的概率。具体而言,年龄较大、女性比男性、受教育年限较高、未婚和进城前未有非务农经历的农民工实现职业向上流动的概率较大。在家庭特征和村庄特征方面,家庭同住人口较多、未进行过土地流转和老家外出务工经商比例较小则有利于农民工实现职业向上流动。其余如农民工身体健康状况、家庭收入和老家所在村庄与最近寄宿中学的距离等,均对农民工职业流动不存在显著影响。

    在本文的计量模型中,会因反向因果关系和遗漏关键变量而存在内生性问题,进而可能导致基准估计结果产生偏误。具体而言,一方面,实现职业流动的农民工可能会减少同乡聚居的概率。另一方面,虽然本文加入了更多控制变量,但仍可能遗漏关键变量。比如,农民工个人能力的差异,而其可能会影响农民工实现职业向上流动的概率。接下来,本文采用工具变量法对上述内生性问题进行处理。

    1. 工具变量

    参考陈云松在上层集聚数据中寻找工具变量的思路,本文选取“城市层面的农民工同户籍集聚程度”作为同乡聚居的工具变量[32]。在研究聚居或居住隔离时,选取省、市或县级层面的汇总数据(aggregation data)作为学校、邻里等层面解释变量的工具变量,是已有文献的常用做法[33]。一方面,采用“城市层面的农民工同户籍集聚程度”作为农民工“同乡聚居”的工具变量,则与Bentolila等的做法类似[34]。具体而言,由于城乡二元制度的分割、城市公共服务的非均等,以及自身较低的人力资本水平,以亲缘、地缘等为纽带的社会网络成为农民工进城后获得生活支持与就业机会的重要渠道,而借助社会网络获取信息和资源会使其更倾向于选择与同乡聚居[29]。当城市层面的同户籍集聚程度较高时,则为农民工利用社会网络提供了条件,从而使农民工更好地选择与同乡聚居,即满足相关性假设。另一方面,城市层面的同户籍集聚程度不会直接影响到农民工的职业流动。这是因为,城市层面的同户籍集聚程度只会影响到农民工进城地点及进城后的居住选择,不会直接影响到农民工进城后在劳动力市场上的表现。

    对于城市层面的同户籍集聚程度的测量,本文借鉴王春超和王聪的做法,采用产业集聚研究中的区位熵指数计算方法,对“地缘集聚”进行度量[35]。在本文中,该度量方式的计算公式如下:

    $$ L Q_{i j}=\frac{E_{i j} \Big/ {\displaystyle\sum}_j E_{i j}}{{\displaystyle\sum}_i E_{i j} \Big/ {\displaystyle\sum}_i {\displaystyle\sum}_j E_{i j}} $$ (13)

    其中,$ i $表示户籍所在省份,$ j $表示流入城市,$ {E}_{ij} $ 表示从 $ i $地到$ j $地的人数,将统计加总的数据代入公式中即可计算出区位熵,$ {LQ}_{ij} $为计算得到的区位熵指数,代表$ i $户籍地流动人口在 $ j $ 地的集聚程度。

    2. 异方差工具变量法

    在本文中,同乡聚居为二值虚拟变量,而IV-probit两步法模型仅适用于处理内生变量为连续变量的情形,因而IV-probit模型难以处理在本文中的内生性问题。鉴于此,本文采用Lewbel提出的异方差工具变量法(heteroskedasticity-based instruments)进行处理[36]。该方法被认为是构造工具变量的一个有效方法[37],且适用于因变量或内生变量为二值虚拟变量的情形[38]。在本文中,模型的具体设定如下:

    $$ {\mathrm{occupup}}={\beta }_{2}Z+{\beta }_{3}{\mathrm{neigh}}+{\xi }_{1},{\xi }_{1}={\eta }_{1}M+{I}_{1}$$ (14)
    $$ {\mathrm{neigh}}={\beta }_{4}Z+{\xi }_{2},{\xi }_{2}={\eta }_{2}M+{I}_{2}$$ (15)

    其中,$ {\mathrm{occupup}} $为农民工的职业向上流动状况,$ {\mathrm{neigh}} $为内生变量,即同乡聚居,$ Z $为外生变量向量组,在本文中包括控制变量、城市固定效应和时间固定效应。$ M $为不可观测因素。$ {I}_{1} $、$ {I}_{2} $为误差项。当式(15)的误差项满足异方差性时,可以利用$ \left[Z-E\left(Z\right)\right]{\xi }_{2} $作为内生变量的工具变量。然后,使用所构造的工具变量估计系数$ {\beta }_{3} $。

    在使用异方差工具变量法时,要求式(15)的误差项为异方差,表3报告了方差的似然比检验(likelihood-ratio)结果,从中可以看出,检验结果强烈拒绝同方差的原假设,说明满足异方差的假设。将式(15)生成的工具变量(生成IV)及“城市层面的农民工同户籍集聚程度”(采用IV)一同作为工具变量,引入式(14)进行估计,可以得到仅采用生成的工具变量,以及含生成的工具变量与“城市层面的农民工同户籍集聚程度”作为工具变量的估计结果。从表3可知,一阶段F值大于经验值10,说明工具不存在弱工具变量问题。此时,同乡聚居的系数均显著为负,均依然支持本文结论。

    表  3  内生性处理
    变量 (1) (2) (3) (4)
    生成IV 生成IV+采用IV 生成IV 生成IV+采用IV
    同乡聚居 −0.057** −0.056** −0.056** −0.056**
    (0.026) (0.026) (0.025) (0.025)
    控制变量 已控制 已控制 已控制 已控制
    年份固定效应 未控制 未控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制
    N 7762 7762 7762 7762
    一阶段F值 19.65 19.86 21.72 22.23
    似然比检验(p值) 0.000 0.000 0.000 0.000
    注:括号中为稳健性标准误。
    下载: 导出CSV 
    | 显示表格

    1. 选择性偏误处理

    上述估计结果可能因可观测或不可观测特征而存在选择性偏误。对于可观测变量所导致的选择性偏误,本文通过倾向得分匹配方法(Propensity Score Matching,PSM)来处理。从表4第(1)列可以看出,采用1对1近邻匹配法进行倾向得分匹配后,同乡聚居的平均处理效应显著为负,说明在处理可观测因素所导致选择性偏误后,选择同乡聚居的农民工实现职业向上流动的概率更低。除1对1匹配方法外,本文还尝试采用了1∶4近邻、核匹配、样条匹配、半径匹配、线性局部匹配等方法,从表4第(2)~(6)列知,结论仍成立。

    表  4  处理选择性偏误I
    变量 (1) (2) (3) (4) (5) (6)
    近邻匹配(1∶1) 近邻匹配(1∶4) 核匹配 样条匹配 半径匹配 线性局部匹配
    ATT −0.046* −0.041** −0.045*** −0.043*** −0.044*** −0.044***
    (0.024) (0.018) (0.013) (0.016) (0.014) (0.014)
    协变量 已控制 已控制 已控制 已控制 已控制 已控制
    N 7762 7762 7762 7762 7762 7762
    注:括号中为Bootstrap标准误。
    下载: 导出CSV 
    | 显示表格

    对于不可观测因素所导致的选择性偏误,本文接下来遵循Heckman[39]样本选择模型,采用处理效应模型对不可观测变量所导致的选择性偏误进行处理。具体而言,首先在第一阶段用同乡聚居作为因变量对排他约束性变量和控制变量进行Probit估计,并计算出逆米尔斯比率(Inverse Mills Ratio,IMR)。其中,排他约束性变量类似于工具变量,要求与同乡聚居相关而外生于农民工的职业流动,这里依旧选择“城市层面的农民工同户籍集聚程度”作为排他约束性变量。其次,在第二阶段中,将逆米尔斯比率(IMR)加入到基准Probit模型中,考察逆米尔斯比率的显著性。依据上述做法,处理效应模型的估计结果见表5。从中可以看出,逆米尔斯比率(IMR)不显著,拒绝模型中存在选择性偏误的原假设,表明基准模型中不存在因不可观测因素所导致的选择性偏误。表5的估计结果未改变本文结论。

    表  5  处理选择性偏误II
    变量 (1) (2) (3)
    第一阶段 第二阶段 第一阶段 第二阶段 第一阶段 第二阶段
    同乡聚居 −0.030** −0.030** −0.035***
    (0.013) (0.013) (0.013)
    城市层面的农民工同户籍集聚程度 0.007*** 0.006** 0.006***
    (0.002) (0.002) (0.002)
    IMR 0.004 0.002 0.002
    (0.017) (0.017) (0.017)
    控制变量 已控制 已控制 已控制 已控制 已控制 已控制
    年份固定效应 未控制 未控制 已控制 已控制 已控制 已控制
    城市固定效应 未控制 未控制 未控制 未控制 已控制 已控制
    N 7762 7762 7762 7762 7762 7762
    pseudo R2 0.015 0.054 0.088 0.054 0.091 0.059
    注:估计系数为边际效应,括号中为由Delta方法计算出的标准误。
    下载: 导出CSV 
    | 显示表格

    2. 其他稳健性检验

    本文采用替换计量模型、替换变量、增加控制变量和分样本估计等方法,进一步检验本文结论的稳健性。当被解释变量为二值虚拟变量时,除可采用Pobit模型进行估计外,还可使用与Probit模型在分布函数存在差异的Logit模型。从表6第(1)列所报告,Logit模型的估计结果依然支持本文结论。在基准模型中,本文从社会地位角度,具体采用“国际社会经济地位指数(ISEI)”这一客观指标来测度农民工的职业流动状况。为了更好地检验结论的可靠性,本文也尝试采用主观法对农民工职业向上流动进行了测度。从表6的第(2)列可知,同乡聚居的估计系数依然显著为负,没有改变本文的研究结论。考虑到农民工所从事的行业可能会影响到农民工的职业,即可能遗漏行业层面不随时间改变的重要变量,从而使估计结果有偏。本文尝试控制农民工现职的行业,表6的第(3)列的估计结果依然支持本文结论。此外,本文还尝试替换数据进行研究,即采用RUMiC2008和RUMiC2009的混合截面数据进行分析。如表6的第(4)列所示,与本文研究结论相一致。

    表  6  稳健性检验I
    变量 替换计量模型 替换变量 增加控制变量 替换数据
    (1)Logit (2)Probit (3)Probit (4)Probit
    同乡聚居 −0.034*** −0.024* −0.023* −0.056***
    (0.013) (0.013) (0.013) (0.012)
    控制变量 已控制 已控制 已控制 已控制
    年份固定效应 已控制 已控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制
    行业固定效应 未控制 未控制 已控制 已控制
    N 7762 7762 7757 6150
    pseudo R2 0.059 0.191 0.089 0.094
    注:采用OLS估计时,括号中为稳健性标准误。
    下载: 导出CSV 
    | 显示表格

    考虑到各个城市的经济发展阶段和劳动力市场完善程度不同,相应农民工的职业流动机会可能存在差异。虽然基准模型中已经控制城市固定效应来缓解上述影响,但仍然会可能影响到本文结果。因此,本文尝试删除经济发展程度相对较高的上海、广州和深圳三个城市中的农民工样本后,再进行估计。估计结果见表7第(1)列,依然支持本文结论。同理,考虑到特殊行政地位可能使副省级及以上城市或省会城市与普通地级市中的样本不可比,本文也尝试删除在洛阳、蚌埠、无锡和东莞四个普通地级城市中的样本后再进行估计,表7第(2)列中同乡聚居的系数依然显著为负,未改变本文结论。鉴于本市农民工可能在本地的社会资本更加丰富,尤其是弱关系,因而本文也尝试删除本市农民工进行估计,表7第(3)列中的估计结果依然稳健。为了消除农民工“一步登天”或“一落千丈”等极端情形对农民工职业流动的影响,本文将现职ISEI值与初职ISEI值之差进行1%水平的缩尾,之后根据缩尾后的差值再衡量农民工职业流动的情况,缩尾后的估计结果见表7第(4)列。从中可知,估计结果无明显变化。考虑到农民工的技能差异可能会影响到本文的估计结果,本文还尝试将农民工根据不同的受教育年限分组后进行估计。具体为将受教育年限大于9年的归为高技能,小于及9年的归为低技能,然后再进行估计。表7第(5)和(6)列的估计结果说明,本文结论依然稳健。同时,本文也采用费舍尔组合检验(Fisher’s permutation test)对两个组别间系数的差异性进行检验。可以看出,组间差异检验结果不显著,说明无论是高技能,抑或是低技能农民工,选择同乡聚居均不利于其实现职业向上流动。

    表  7  稳健性检验II
    变量 删除样本 1%水平缩尾 分样本
    (1) (2) (3) (4) (5) (6)
    同乡聚居 −0.034** −0.043*** −0.036** −0.036*** −0.030* −0.043*
    (0.015) (0.015) (0.014) (0.013) (0.016) (0.024)
    控制变量 已控制 已控制 已控制 已控制 已控制 已控制
    年份固定效应 已控制 已控制 已控制 已控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制 已控制 已控制
    N 6021 6076 6305 7762 5121 2641
    pseudo R2 0.066 0.044 0.066 0.063 0.069 0.060
    组间差异系数检验 −0.011
    下载: 导出CSV 
    | 显示表格

    结合理论分析可知,居住空间隔离所导致的社会空间隔离,是同乡聚居不利于农民工实现职业向上流动的重要原因。具体而言,以地缘、亲缘等为纽带的先赋性社会网络虽能够为初进城的农民工提供就业支持,但这种网络是封闭和狭隘的,不仅造成农民工在城市中所能接触到的资源极为有限,也无法保证农民工在摩擦失业中获得稳定支持。更重要的是,选择与同乡聚居会进一步造成农民工移植和复制以亲缘、地缘为纽带的先赋性社会网络,无法建构以业缘、趣缘等为纽带的自致性社会网络,从而降低了其实现职业向上流动的可能性[40]。接下来,本文对上述可能存在的影响机制进行检验。

    对于农民工先赋性社会网络,本文用对邻里的认识情况来衡量,具体为“所认识或了解的邻居中,同乡所占的比例”。可知,农民工所认识或了解的同乡比例越高,则说明农民工越倾向于与先赋性社会网络进行社会互动,从而不利于其建构自致性社会网络。首先,考察同乡聚居对农民工先赋性社会网络的影响。用农民工的先赋性社会网络作为被解释变量对同乡聚居分别进行估计。从表8的第(1)列可以看出,同乡聚居会显著提高农民工与先赋性社会网络进行社会互动的概率。其次,考察先赋性社会网络对农民工职业流动的影响。从表8的第(2)列可以看出,先赋性社会网络不利于农民工的职业向上流动。

    表  8  影响机制分析
    变量 (1) OLS (2) Probit (3) Probit (4) Probit (5) Probit
    先赋性社会网络 职业向上流动 求职网 职业向上流动 职业水平流动
    同乡聚居 0.197*** 0.055*** 0.010
    (0.009) (0.013) (0.007)
    先赋性社会网络 −0.057***
    (0.021)
    求职网 −0.144***
    (0.011)
    截距项 0.057*
    (0.030)
    控制变量 已控制 已控制 已控制 已控制 已控制
    年份固定效应 已控制 已控制 已控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制 已控制
    N 7762 7762 7762 7762 7762
    R2/Pseudo R2 0.135 0.059 0.097 0.075 0.042
    下载: 导出CSV 
    | 显示表格

    此外,为了更好地体现社会网络作为求职的工具性行动功能或工作机会可达性,本文还尝试用“获得当前这份主要工作的途径”,即求职网作为社会互动的代理变量,具体为若通过家人、亲戚、朋友和熟人实现就业则赋值为1,否则为0。如从表8的第(3)和(4)所示,选择同乡聚居的农民工更愿意借助社会网络求职和就业,而社会网络求职和就业不利于农民工的职业向上流动,结果依然支持上述机制。

    以往研究表明,同乡聚居除了通过社会空间隔离外,还可能导致职业趋同及报团取暖,进而影响农民工的职业流动状况。如同乡聚居通过同业同居、风险分担等作用,影响到农民工的就业选择。本文也尝试对上述可能的影响机制进行了检验。首先检验职业趋同影响机制的存在性。用农民工职业水平流动的状况,来测度农民工职业趋同程度。若差值等于0意味着农民工职业为水平流动,赋值为1,否则赋值为0。用农民工职业水平流动作为被解释变量对同乡聚居选择进行Probit模型估计。如表8第(5)列所报告,同乡聚居的系数为正,但不显著,说明同乡聚居并不一定显著导致职业趋同,即该影响机制不存在。其次,检验风险分担影响机制的存在性。假如同乡聚居确实是通过风险分担或“抱团取暖”机制影响了农民工的职业选择,那么,同乡聚居对面临风险程度更大的农民工职业向上流动的负效应,将显著大于面临风险程度更小的农民工。参考Zhou [41]、王春超和王聪[35]等的做法,我们采用农民工技能水平、身体健康状况、家庭存款额等变量来衡量农民工所面临的风险程度。可知,技能水平较低、身体健康状况较差和家庭存款较少的农民工,面临的风险程度会相对较大,从而通过报团取暖影响自身的职业流动状况。技能水平较高的农民工抵御未来风险的能力要高于低技能农民工,身体健康程度较高的农民工抵御未来风险的能力要高于身体健康欠佳的农民工,存款多的农民工比存款少的农民工更能应对未来的不确定性,抵御各种风险。对于技能水平,参考梁文泉和陆铭[42]的做法,本文用农民工的教育年限测度,若教育年限大于9年则为高技能,赋值为1,否则赋值为0;对于身体健康状况,若农民工目前身体状况为不好或非常不好赋值为1,否则赋值为0;对于家庭存款额,用过去12个月的储蓄额(包括在外出务工地存入储蓄的数额,但不包括寄回及带回老家的存款)来衡量。同时参考Ai 和 Norton的做法,我们提出的交互项的方法检验同乡聚居内部风险分担机制的存在[43]。从表9估计结果可以看出,交互效应的平均值虽均大于0,但相应的Z值均小于1.96,说明交互效应均不显著,即同乡聚居的风险分担机制不存在。

    表  9  影响机制分析
    变量 观测值 平均值 最小值 最大值
    技能水平 交互项的偏效应 7762 0.001 −0.001 0.003
    标准误 7762 0.028 0.007 0.032
    Z值 7762 0.034 −0.073 0.124
    身体健康状况 交互项的偏效应 7762 0.063 0.016 0.071
    标准误 7762 0.092 0.023 0.105
    Z值 7762 0.686 0.673 0.698
    家庭存款额 交互项的偏效应 7701 0.001 0.000 0.001
    标准误 7701 0.003 0.001 0.004
    Z值 7701 0.221 0.158 0.314
    注:估计时包含核心解释变量同乡聚居、风险程度变量,以及相关控制变量、年份和城市固定效应。
    下载: 导出CSV 
    | 显示表格

    以上估计结果表明,选择与同乡聚居的农民工更倾向于与先赋性社会网络中的成员进行互动,不利于农民工建构自致性社会网络,进而使自己缺乏实现职业向上流动的机会,即地理空间隔离所导致的社会空间隔离,是同乡聚居不利于农民工实现职业向上流动的重要原因,从而验证了第二个研究假说。

    促进农民工的职业向上流动,对深入推进新型城镇化战略与实现全体人民的共同富裕具有重要意义。目前农民工的流动总体表现为乡城间的横向流动,职业的纵向流动尚未充分展开,且在横向流动的过程中,农民工倾向于选择与同乡在空间上相聚而居。国内现有文献鲜有从同乡聚居视角分析农民工的职业流动,即研究横向流动过程中的典型特征对农民工纵向流动的影响,并提供经济学的理论支撑。本文在空间错配视角下对此进行了实证探讨。研究表明,选择与同乡聚居不利于农民工的职业向上流动。进一步的研究发现,居住空间隔离所导致的社会空间隔离,是选择与同乡聚居不利于农民工的职业向上流动的重要原因。

    结合本文的主要结论,可以得出如下政策启示:

    第一,正确认识同乡聚居在农民工职业发展中的作用。同乡聚居的确为缺乏城市社会资本的农民工提供了获取就业机会和资源的渠道,有利于其进城初期实现就业。然而,本文的研究结论表明,这种聚居选择从长远层面强化了农民工对同乡聚居的依赖,不利于其职业向上流动。因此,应基于同乡聚居产生的机理,减少农民工对同乡聚居的过度依赖。在就业方面,应为农民工提供就业方面的服务,改善交通、信息传播条件以降低农民工的工作搜寻成本。比如,应建立一些公益性的为促进农民工就业的职业中介机构,有针对性地开展各种职业招聘活动,避免农民工付出中介费、担保费和面试费等成本。由于政策取向和财政能力的限制,农民工长期徘徊在住房政策之外,城市住房制度对农民工的考虑还不充分。此外,由于户籍等制度障碍,农民工尚未纳入城市住房保障体系,即使符合廉租房和经济适用房条件,也无法享受相应政策。因而,在住房方面,应构建和完善覆盖农民工的城镇住房保障体系,逐渐向农民工开放各类保障性住房。比如,以就业类型、就业年限、居住年限等设置保障性住房的申请门槛,将住房保障服务优先提供给有意愿在本地定居落户的农民工。在住房保障体系建设的同时,加快中低端住房租赁市场培育和管理,培育和发展面向农民工群体的住房租赁企业,鼓励房地产开发企业在聚居区开展住房租赁业务。搭建城市租房公共平台,提高住房市场信息的可得性、透明性。比如,可探索建立“政府支持、市场主导”的农民工住房信息支持平台,并在农民工同乡聚居地设立分支,掌握农民工住房市场动态,为支持改进提供数据和技术支持。

    第二,促进农民工与本地人的社会互动,消除农民工的空间隔离。本文的机制分析表明,居住空间隔离所导致的社会空间隔离,是选择与同乡聚居不利于农民工的职业向上流动的重要原因。也即,农民工进城后多倾向于与以血缘、地缘等为纽带的强关系进行社会互动,较少与本地人建立社会联系或互动,进而使自己较难获取异质性或高质量的工作信息。因而,应采用措施促进农民工与本地人的社会互动,消除二者之间的社会空间隔离。比如,社会各界尤其是城市本地居民应正确认识农民工对城市的贡献,避免对农民工的社会排斥和歧视。应将农民工纳入城市社区日常管理对象范围之内,促进农民工与本地居民之间的社区交往和人际互动。应鼓励农民工加入工会组织,不仅可以扩展其基于业缘的社会关系网络,还可以提升其城市融入感。此外,中国在子女的教育、基本医疗和基本社会保障服务等方面的地区差异、城乡差异、体制内外差异,强化了农民工对地缘和亲缘关系的主观依赖,进一步加剧了社会空间隔离。因而,应构筑覆盖全体居民的公共服务体系,使农民工享受均等化的公共服务待遇。

    第三,引导农民工构建异质性社会网络,扩宽就业信息获取渠道。本文进一步研究表明,选择与同乡聚居不利于农民工的职业向上流动,且上述负面影响会因农民工与弱关系互动的增多而减弱。目前大部分农民工通过以亲缘、地缘等为纽带的乡土社会网络获取就业信息,为了更好地利用社会网络获取资源和信息,选择同乡聚居的农民工会更倾向于与同乡进行社会互动,进而阻碍了自身就业能力的提升。因而,应引导农民工构建异质性社会网络,扩宽就业信息获取渠道。首先,应鼓励农民工构建的基于业缘、趣缘等为纽带的现代社会网络,减少对基于地缘、血缘等为纽带的乡土社会网络的依赖。其次,应完善良好的就业服务体系,逐步形成集就业信息、就业咨询、岗位介绍等一体化的农民工就业服务体系;也可以利用“大数据、互联网+、云计算”等信息技术,搭建就业信息公共平台,使农民工能够充分利用互联网等信息化手段来提高工作搜寻效率,进一步提高职业信息的对称程度。

  • 表  1   主要变量的描述性统计特征

    变量名称 变量具体含义 总样本 非同乡聚居 同乡聚居 均值差异检验
    职业流动方向 虚拟变量,向上=1,向下或水平=0 0.650 0.666 0.592 0.074***
    同乡聚居 周围住着很多同乡,虚拟变量,是=1,否=0 0.207 0.000 1.000
    性别 虚拟变量,男=1,女=0 0.562 0.558 0.576 −0.018
    年龄 个人年龄(岁) 36.764 36.736 36.869 −0.133
    婚姻状况 虚拟变量,已婚=1,未婚=0 0.775 0.771 0.788 −0.017
    受教育水平 个人受正规教育年限(年) 8.904 8.982 8.608 0.374***
    身体健康状况 虚拟变量,好=1,不好=0 0.819 0.827 0.789 0.038***
    非务农经历 进城前有非农工作经历,虚拟变量,有= 1,无=0 0.036 0.035 0.041 −0.006
    家庭同住人口规模 目前共同生活的家庭成员人数(人) 2.453 2.491 2.308 0.183***
    家庭收入 家庭收入(元),取对数 8.624 8.615 8.655 −0.040
    家庭耕地流转状况 虚拟变量,转给别人或村集体代耕=1,其他=0 0.331 0.331 0.329 0.002
    劳动力外流状况 老家所在村劳动力外出务工经商的比例 0.618 0.615 0.632 −0.017**
    与最近中学距离 老家所在村距最近寄宿初中的距离(公里),取对数 1.788 1.808 1.710 0.098***
    观测值 7762 6153 1609
    注:均值差异检验指变量在“非同乡聚居”样本组与“同乡聚居”样本组之间的均值差异检验。
    下载: 导出CSV

    表  2   基准回归结果

    变量 (1) (2) (3) (4) (5)
    同乡聚居 −0.070*** −0.053*** −0.030** −0.059*** −0.035***
    (0.013) (0.013) (0.013) (0.013) (0.013)
    性别 −0.028** −0.027** −0.027** −0.025** −0.024**
    (0.011) (0.011) (0.011) (0.011) (0.011)
    年龄 0.002*** 0.003*** 0.003*** 0.003*** 0.003***
    (0.001) (0.001) (0.001) (0.001) (0.001)
    婚姻状况 0. 042** −0.049*** −0.046*** −0.045*** −0.042**
    (0.016) (0.017) (0.017) (0.017) (0.017)
    受教育水平 0.004* 0.005*** 0.005*** 0.005** 0.005***
    (0.002) (0.002) (0.002) (0.002) (0.002)
    身体健康状况 0.024* 0.013 −0.009 0.027* 0.004
    (0.014) (0.014) (0.014) (0.014) (0.014)
    非务农经历 −0.108*** −0.090*** −0.069** −0.092*** −0.071**
    (0.029) (0.028) (0.028) (0.028) (0.028)
    家庭同住人口规模 0.075*** 0.063*** 0.079*** 0.067***
    (0.005) (0.005) (0.005) (0.005)
    家庭收入 −0.014** −0.004 −0.013** −0.004
    (0.005) (0.005) (0.005) (0.005)
    家庭耕地流转状况 −0.027** −0.025** −0.026** −0.025**
    (0.012) (0.012) (0.012) (0.011)
    劳动力外流状况 −0.054** −0.056** −0.036 −0.042*
    (0.023) (0.024) (0.023) (0.024)
    与最近中学距离 0.010 −0.002 0.011* −0.002
    (0.006) (0.006) (0.006) (0.006)
    城市固定效应 未控制 未控制 已控制 未控制 已控制
    年份固定效应 未控制 未控制 未控制 已控制 已控制
    N 7762 7762 7762 7762 7762
    pseudo R2 0.008 0.036 0.054 0.041 0.059
    注:括号中为采用德尔塔方法(Delta method)计算出的标准误;估计系数为边际效应;*、**、***分别表示在10%、5%、1%水平上显著。下同。
    下载: 导出CSV

    表  3   内生性处理

    变量 (1) (2) (3) (4)
    生成IV 生成IV+采用IV 生成IV 生成IV+采用IV
    同乡聚居 −0.057** −0.056** −0.056** −0.056**
    (0.026) (0.026) (0.025) (0.025)
    控制变量 已控制 已控制 已控制 已控制
    年份固定效应 未控制 未控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制
    N 7762 7762 7762 7762
    一阶段F值 19.65 19.86 21.72 22.23
    似然比检验(p值) 0.000 0.000 0.000 0.000
    注:括号中为稳健性标准误。
    下载: 导出CSV

    表  4   处理选择性偏误I

    变量 (1) (2) (3) (4) (5) (6)
    近邻匹配(1∶1) 近邻匹配(1∶4) 核匹配 样条匹配 半径匹配 线性局部匹配
    ATT −0.046* −0.041** −0.045*** −0.043*** −0.044*** −0.044***
    (0.024) (0.018) (0.013) (0.016) (0.014) (0.014)
    协变量 已控制 已控制 已控制 已控制 已控制 已控制
    N 7762 7762 7762 7762 7762 7762
    注:括号中为Bootstrap标准误。
    下载: 导出CSV

    表  5   处理选择性偏误II

    变量 (1) (2) (3)
    第一阶段 第二阶段 第一阶段 第二阶段 第一阶段 第二阶段
    同乡聚居 −0.030** −0.030** −0.035***
    (0.013) (0.013) (0.013)
    城市层面的农民工同户籍集聚程度 0.007*** 0.006** 0.006***
    (0.002) (0.002) (0.002)
    IMR 0.004 0.002 0.002
    (0.017) (0.017) (0.017)
    控制变量 已控制 已控制 已控制 已控制 已控制 已控制
    年份固定效应 未控制 未控制 已控制 已控制 已控制 已控制
    城市固定效应 未控制 未控制 未控制 未控制 已控制 已控制
    N 7762 7762 7762 7762 7762 7762
    pseudo R2 0.015 0.054 0.088 0.054 0.091 0.059
    注:估计系数为边际效应,括号中为由Delta方法计算出的标准误。
    下载: 导出CSV

    表  6   稳健性检验I

    变量 替换计量模型 替换变量 增加控制变量 替换数据
    (1)Logit (2)Probit (3)Probit (4)Probit
    同乡聚居 −0.034*** −0.024* −0.023* −0.056***
    (0.013) (0.013) (0.013) (0.012)
    控制变量 已控制 已控制 已控制 已控制
    年份固定效应 已控制 已控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制
    行业固定效应 未控制 未控制 已控制 已控制
    N 7762 7762 7757 6150
    pseudo R2 0.059 0.191 0.089 0.094
    注:采用OLS估计时,括号中为稳健性标准误。
    下载: 导出CSV

    表  7   稳健性检验II

    变量 删除样本 1%水平缩尾 分样本
    (1) (2) (3) (4) (5) (6)
    同乡聚居 −0.034** −0.043*** −0.036** −0.036*** −0.030* −0.043*
    (0.015) (0.015) (0.014) (0.013) (0.016) (0.024)
    控制变量 已控制 已控制 已控制 已控制 已控制 已控制
    年份固定效应 已控制 已控制 已控制 已控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制 已控制 已控制
    N 6021 6076 6305 7762 5121 2641
    pseudo R2 0.066 0.044 0.066 0.063 0.069 0.060
    组间差异系数检验 −0.011
    下载: 导出CSV

    表  8   影响机制分析

    变量 (1) OLS (2) Probit (3) Probit (4) Probit (5) Probit
    先赋性社会网络 职业向上流动 求职网 职业向上流动 职业水平流动
    同乡聚居 0.197*** 0.055*** 0.010
    (0.009) (0.013) (0.007)
    先赋性社会网络 −0.057***
    (0.021)
    求职网 −0.144***
    (0.011)
    截距项 0.057*
    (0.030)
    控制变量 已控制 已控制 已控制 已控制 已控制
    年份固定效应 已控制 已控制 已控制 已控制 已控制
    城市固定效应 已控制 已控制 已控制 已控制 已控制
    N 7762 7762 7762 7762 7762
    R2/Pseudo R2 0.135 0.059 0.097 0.075 0.042
    下载: 导出CSV

    表  9   影响机制分析

    变量 观测值 平均值 最小值 最大值
    技能水平 交互项的偏效应 7762 0.001 −0.001 0.003
    标准误 7762 0.028 0.007 0.032
    Z值 7762 0.034 −0.073 0.124
    身体健康状况 交互项的偏效应 7762 0.063 0.016 0.071
    标准误 7762 0.092 0.023 0.105
    Z值 7762 0.686 0.673 0.698
    家庭存款额 交互项的偏效应 7701 0.001 0.000 0.001
    标准误 7701 0.003 0.001 0.004
    Z值 7701 0.221 0.158 0.314
    注:估计时包含核心解释变量同乡聚居、风险程度变量,以及相关控制变量、年份和城市固定效应。
    下载: 导出CSV
  • [1] 李实. 共同富裕的目标和实现路径选择[J]. 经济研究, 2021(11): 4-13.
    [2] 朱玲, 何伟. 脱贫农户的社会流动与城乡公共服务[J]. 经济研究, 2022(3): 25-48.
    [3] 蔡昉. 促进社会流动的市场机会、社会政策和家庭养育[J]. 劳动经济研究, 2024(2): 3-16.
    [4]

    BACHMANN R, BECHARA P, VONNAHME C. Occupational mobility in Europe: extent, determinants and consequences[J]. De Economist, 2020, 168: 79-108. doi: 10.1007/s10645-019-09355-9

    [5]

    ABRAMITZKY R, BOUSTAN L, JáCOME E, et al. Intergenerational mobility of immigrants in the United States over two centuries[J]. American Economic Review, 2021, 111(2): 580-608. doi: 10.1257/aer.20191586

    [6] 吕晓兰, 姚先国. 农民工职业流动类型与收入效应的性别差异分析[J]. 经济学家, 2013(6): 57-68.
    [7] 石智雷, 吕琼琼, 易成栋. 职业水平流动和垂直流动对农民工城市融入的影响[J]. 中南财经政法大学学报, 2016(6): 22-29. doi: 10.3969/j.issn.1003-5230.2016.06.003
    [8] 明娟. 工作转换对农民工职业流动的影响效应[J]. 人口与经济, 2016(4): 113-120. doi: 10.3969/j.issn.1000-4149.2016.04.012
    [9] 杨凡, 潘越. 非正规就业对流动人口职业流动意愿的影响[J]. 人口研究, 2019(4): 97-112.
    [10] 李军, 李敬. 新型城镇化能改善代际流动性吗?[J]. 劳动经济研究, 2020(1): 44-71.
    [11] 李强. 中国大陆城市农民工的职业流动[J]. 社会学研究, 1999(3): 95-103.
    [12] 卓玛草, 孔祥利. 农民工代际职业流动: 代际差异与代际传递的双重嵌套[J]. 财经科学, 2016(6): 84-96.
    [13]

    EASLEY J. Spatial Mismatch beyond black and white: levels and determinants of job access among Asian and Hispanic subpopulations[J]. Urban Studies, 2018, 55(8): 1800-1820. doi: 10.1177/0042098017696254

    [14]

    HELLERSTEIN J K, NEUMARK D, MCIERNEY M. Spatial mismatch or racial mismatch?[J]. Journal of Urban Economics, 2008, 64(2): 464-479. doi: 10.1016/j.jue.2008.04.003

    [15]

    PATEL K, VELLA F. Immigrant networks and their implications for occupational choice and wages[J]. Review of Economics and Statistics, 2013, 95(4): 1249-1277. doi: 10.1162/REST_a_00327

    [16]

    KAIN J F. Housing segregation, Negro employment, and metropolitan decentralization[J]. The Quarterly Journal of Economics, 1968, 82(2): 175-197. doi: 10.2307/1885893

    [17] 张可云, 杨孟禹. 城市空间错配问题研究进展[J]. 经济学动态, 2015(12): 99-110.
    [18]

    WANG L, WU C, ZHAO S. A review of spatial mismatch research: empirical debate, theoretical evolution and connotation expansion[J]. Land, 2022, 11(7): 1049. doi: 10.3390/land11071049

    [19]

    ANDERSSON F, HALTIWANGER J C, KUTZBACH M J, et al. Job displacement and the duration of joblessness: the role of spatial mismatch[J]. Review of Economics and Statistics, 2018, 100(2): 203-218. doi: 10.1162/REST_a_00707

    [20]

    ZENOU Y. Spatial versus social mismatch[J]. Journal of Urban Economics, 2013, 74: 113-132. doi: 10.1016/j.jue.2012.11.002

    [21] 陆文荣, 段瑶. 居住的政治: 农民工居住隔离的形成机制与社会后果[J]. 中国农业大学学报(社会科学版), 2019(2): 44-58.
    [22] 王汉生, 刘世定, 孙立平, 等. “浙江村”: 中国农民进入城市的一种独特方式[J]. 社会学研究, 1997(1): 58-69.
    [23] 杨高, 周春山. 深圳富士康农民工聚居区研究: 空间生产与社会流动[J]. 现代城市研究, 2019(11): 26-32. doi: 10.3969/j.issn.1009-6000.2019.11.004
    [24] 张春泥, 谢宇. 同乡的力量: 同乡聚集对农民工工资收入的影响[J]. 社会, 2013(1): 113-135.
    [25] 魏万青, 高伟. 同乡网络的另一幅脸孔: 雇主—工人同乡关系对劳工个体权益的影响[J]. 社会, 2019(2): 160-185. doi: 10.3969/j.issn.1004-8804.2019.02.007
    [26]

    BI L, FANa Y, GAO M, et al. Spatial mismatch, enclave effects and employment outcomes for rural migrant workers: empirical evidence from Yunnan province, China[J]. Habitat International, 2019, 86: 48-60. doi: 10.1016/j.habitatint.2019.02.008

    [27]

    ZHU P. Residential segregation and employment outcomes of rural migrant workers in China[J]. Urban Studies, 2016, 53(8): 1635-1656. doi: 10.1177/0042098015578614

    [28] 曾东林, 吴晓刚, 陈伟. 移民的空间聚集与群体社会距离: 来自上海的证据[J]. 社会, 2021(5): 56-79.
    [29] 刘启超. 社会网络对农民工同乡聚居的影响研究[J]. 经济科学, 2020(2): 101-115.
    [30] 阳义南, 连玉君. 中国社会代际流动性的动态解析——CGSS与CLDS混合横截面数据的经验证据[J]. 管理世界, 2015(4): 79-91.
    [31] 刘启超, 王亚华. 稻作文化对农民工同乡聚居的影响——基于社会网络视角[J]. 中国农村经济, 2024(8): 107-124.
    [32] 陈云松. 逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用[J]. 社会学研究, 2012(6): 192-216.
    [33]

    CARD D, KRUEGER A B. School resources and student outcomes: an overview of the literature and new evidence from North and South Carolina[J]. Journal of Economic Perspectives, 1996, 10(4): 31-50. doi: 10.1257/jep.10.4.31

    [34]

    BENTOLILA S, MICHELACCI C, SUAREZ J. Social contacts and occupational choice[J]. Economica, 2010, 77(305): 20-45. doi: 10.1111/j.1468-0335.2008.00717.x

    [35] 王春超, 袁伟. 社会网络、风险分担与农户储蓄率[J]. 中国农村经济, 2016(3): 25-35.
    [36]

    LEWBEL A. Using Heteroscedasticity to identify and estimate mismeasured and endogenous regressor models[J]. Journal of Business & Economic Statistics, 2012, 30(1): 67-80.

    [37]

    MISHRA V, SMYTH R. Estimating returns to schooling in urban China using conventional and heteroskedasticity-based instruments[J]. Economic Modelling, 2015, 47: 166-173. doi: 10.1016/j.econmod.2015.02.002

    [38]

    LEWBEL A. Identification and estimation using heteroscedasticity without instruments: the binary endogenous regressor case[J]. Economics Letters, 2018, 165: 10-12. doi: 10.1016/j.econlet.2018.01.003

    [39]

    HECKMAN J. Sample selection bias as a specification error[J]. Econometrica, 1979, 47(1): 153-161 doi: 10.2307/1912352

    [40] 梁辉. 农民工职业搜寻过程及其对职业向上流动的影响——基于搜寻与匹配理论[J]. 农业技术经济, 2016(2): 63-72.
    [41]

    ZHOU W. Brothers, household financial markets and savings rate in China[J]. Journal of Development Economics, 2014, 111: 34-47. doi: 10.1016/j.jdeveco.2014.07.002

    [42] 梁文泉, 陆铭. 后工业化时代的城市: 城市规模影响服务业人力资本外部性的微观证据[J]. 经济研究, 2016(12): 90-103.
    [43]

    AI C, NORTON E C. Interaction terms in logit and probit models[J]. Economics Letters, 2003, 80(1): 123-129. doi: 10.1016/S0165-1765(03)00032-6

表(9)
计量
  • 文章访问数:  29
  • HTML全文浏览量:  13
  • PDF下载量:  5
  • 被引次数: 0
出版历程
  • 收稿日期:  2025-03-09
  • 网络出版日期:  2025-04-15

目录

/

返回文章
返回