为了进一步提高统计工作效率、提高数据质量和优化统计服务,国家统计局于2024年10月,国家统计局将劳动力调查数据全面迁移至统计云平台,实现了统计调查的在线填报、数据审核及验收,优化了统计工作流程。但是该平台在跨期汇总、灵活透视和样本动态监测预警方面的功能不够完善,给市县两级的数据审核与评估工作带来了压力。劳动力调查数据是研判就业形势的“晴雨表”与宏观调控决策的“风向标”,数据采集处理的时效性和准确性至关重要。为破解汇总效率低、分析维度单一、样本监测难等堵点,台州队联合临海队依托Python技术,自主研发了劳动力调查智能汇总小程序,进一步提升数据处理效率,满足个性化分析需求,强化样本监测能力,为深化统计现代化改革提供有益助力与基础支持。
一、统计云平台在数据汇总分析方面的主要不足
(一)跨期汇总能力不足,制约数据处理效率。
以台州地区劳动力调查工作为例,一共设有87个样本点,每月需完成近1400户家庭的走访,累计采集超3000条个人数据,每人约30项核心指标。自劳动力调查数据迁移至统计云平台后,虽然能按月生成300余张分全部、城镇、乡村的三类不同汇总表,但由于平台缺乏跨时间周期的汇总功能,在进行多月数据汇总分析时,只能依靠“手工黏贴、重新计算”的方式处理。例如,当需要对过去一年的数据进行季度汇总分析时,工作人员需要逐月复制数据,再进行整理和计算,整个过程不仅耗时长,而且容易出现计算错误。
(二)指标设计不够灵活,难以适配多元分析。
统计云平台每月生成的汇总表数量虽多,但各表单相互独立,难以灵活支持个性化分析需求。不同分析场景常需特定指标组合与计算方式,而现有表单结构固定,无法自由适配。例如,在编制月度主要数据指标说明报表时,需提供全部、城镇、乡村分组下按年龄、性别、户籍、行业等维度的环比、同比数据。专业人员需下载十余张表格,手工进行数据提取与比对。又如,在研究某一特定产业的就业结构变化时,现有表单无法直接提供不同行业在吸纳不同年龄段、学历层次人员的详细数据,需要专业人员下载多张表格手动整理,增加了分析工作的难度和时间成本。
(三)动态监测功能缺失,影响数据质量管控。
当前统计云平台在数据审核方面,主要侧重于当月数据的逻辑性检查,尚未建立针对样本点的关键指标动态监测机制。对于长期未换户、持续零失业、一人户占比过高、老龄化趋势明显等潜在风险点,目前仍需依靠人工方式进行识别与跟踪,操作过程耗时耗力,且容易发生疏漏。以台州地区为例,市级审核人员需面对87个调查样本点,难以对每个点位的数据质量波动、异常数值等情况进行实时监测与预警。若某一样本点出现数据异常,由于缺乏系统自动提示,问题可能无法被及时发现和处置,对劳动力调查数据质量产生不利影响。
二、智能汇总小程序的设计目标和核心功能
为进一步提升基层数据处理工作的安全性与效率,台州队联合临海调查队基于Python技术研发了劳动力调查智能汇总小程序,确立了“1个小程序、满足3大需求、实现3大提升”的总体架构。
(一)以智能处理技术,实现跨月报表一键汇总。
针对目前统计云系统无法跨月连续汇总的难题,小程序基于平台月度报表结构,创新开发“一键导入-智能分表-动态建模”功能链。程序严格遵循数据安全管理要求,采用单机离线架构,提供基础数据筛选、自定义统计指标及行列百分比等常用聚合运算,有效满足日常统计与报表汇总需求。例如,在汇总2025年上半年各年龄段的人员劳动力调查数据时,上传1-6月的月度调查表,系统即可自动识别千余条数据要素,快速完成跨年、跨月的数据汇总,并智能生成包含15项就业指标的综合汇总表,点击到按年龄分组的汇总结果表,可以直接查看分年龄段的就业人数、失业人数、失业率、劳动参与率等关键指标。通过使用该小程序,专业人员能够显著减少人工操作环节,实现快速、精准的数据汇总。
(二)以指标灵活扩展,实现多维度数据汇总分析。
为满足多样化数据汇总与分析需求,小程序支持用户根据实际情况灵活扩展汇总指标,实现多维度统计功能。通过设置元指标转译各个报表期指标,指标发生变化时只要增加转译表既可适配,并且设置有指标含义转译表,可以应对导出数据变化,指标含义变化等多种情况。另外,支持灵活定制汇总条件,提供分组、透视和筛选功能,实现自定义条件汇总。在程序界面设有汇总设置、跨期指标转换、分组汇总指标设置等七大功能模块,提供分组、透视、筛选等多种操作方式,可便捷完成分户籍、分产业、分样本点的多维度分析。以需要上报的月度主要数据说明表为例,仅需上传相邻月份及去年同期共三张调查表,系统即可自动完成数据汇总与对比分析,并按照报表格式要求,输出包括城乡就业与失业人员变动、劳动参与率、就业人口比、失业率等关键指标在内的四大模块的月度数据说明,显著减轻基分析工作负担。
(三)以可视化监测手段,实现末端样本动态管理。
一是支持多图表同屏独立显示。系统提供柱状图、折线图、热力图等多种可视化方式,便于直观把握数据分布与变动趋势。用户可灵活切换指标,实现多维度数据比对,分析结果支持保存,便于后续培训或汇报使用。例如,在分析特定产业就业结构时,专业人员可选取产业类型、年龄段、学历等维度进行汇总,利用热力图呈现外来人口劳动参与率的区域分布,通过折线图追踪就业人口比动态变化,借助词云图展示就业特色,助力当地产业升级与就业结构优化。二是建立动态监测体系。系统突破传统统计层级限制,构建“市-县-乡(镇)-社区(村)”四级样本库,实现对全市87个样本点的穿透式管理。开发了省到社区(村)的五级样本统计模块,可实时调取样本点的劳动力结构数据,精准监测老年人口、一人户、失业人数、空户与换户等指标的长期动态变化,方便专业人员及时发现样本点异常,作出预警,有效提升对下级单位工作的指导能力。
四、结语
基于Python开发的劳动力调查智能汇总小程序,有效解决了数据跨周期汇总效率低、指标分析不灵活、样本监测滞后等问题。程序操作简单,通过一键汇总、灵活扩展指标、实时监测等核心功能,显著提升了数据处理效率和样本管理能力。未来将继续优化,为劳动力调查工作的智能化和精准化发展提供更便捷的工具。