数据与方法(Data & Method)

发布日期:2025-08-13    来源:

2) 数据与方法

2.1 数据
招聘文本:智联招聘岗位描述(2018–2024 抽样加权 125 万),覆盖 78 个职业组别、346 个职业(用于文内展示统计)。
    智联招聘成立于1994年,目前占据了超过30%的国内在线招聘市场份额。该平台拥有2.3亿活跃个人用户和约600万企业用户,覆盖国内各大中城市,具有广泛的地域代表性
    覆盖时间为2018年1月1日至2024年5月30日。样本来自于按年分层的随机抽样,每自然年度抽取约20万条,加权调整后的总有效样本量约为125万条。 去除了占总样本比例约3.7%的非全职类职位和占约0.07%的境外职位
    最终主分析样本包含125万全职职位,涵盖57个职业大类、1027个职业小类
职业与任务:O*NET 2087 个 DWA、19265 个 Task;采用岗位文本  DWA/Task 的一对多匹配并加权。(具体见技术说明文档)

2.2 方法总览
DWA-based 指数与 Task-based 指数的构造思路(岗位级打分 → 职业/职业组别加权 → 城市层面按职业份额聚合)。
论文版“原始指数”与“新 task-based 指数”的关系与差异(优化数据来源与打分流程)。
城市层面两种口径:间接法(职业暴露×城市职业结构)与直接法(本地招聘暴露均值)。

分享到: