当前位置: 首页 > 审计动态
Python赋能审计整改——高效推进多部门审计整改台账标准化整合
【信息来源:【信息时间:2025-12-23  阅读次数: 】【字号 】【我要打印】【关闭

在审计整改工作实践中,常需将多个被审计部门提交的整改台账汇总整合,期间往往存在字段不统一、格式不一致、冗余信息多等问题。传统人工整合方式不仅繁琐耗时,还可能出现数据误差。为提升工作效能,推动审计整改数据化规范化建设,本文将结合实际工作场景,分享运用Python实现多部门整改台账批量整合的实操方法。

一、工作背景:多部门整改台账整合的现实痛点

经梳理,实际收集的台账材料主要存在以下三方面问题:

(一)字段不统一:各单位台账核心字段表述存在差异,如“问题编号”与“整改序号”“责任部门”与“责任科室”等同义不同名情况;

(二)格式不一致:日期类字段格式混乱,包含“2025-05-20”“2025.05.20”“2025年5月20日”等多种形式,部分日期以文本格式存储;

(三)冗余信息多:部分单位台账额外增设“备注”“联系人”等非核心字段,且核心字段排列顺序不统一,增加整合难度。

传统整合方式需工作人员逐表核对字段、手动调整格式并复制汇总,不仅耗时较长,还存在漏填、错填等数据质量风险痛点。以下通过Python实现台账整合的自动化处理,附完整操作步骤及代码说明。

二、实操实践:Python实现整改台账批量整合

第一步:明确标准化目标,梳理核心字段

结合审计整改工作要求,确定汇总台账的标准化核心字段,包括:问题编号、问题描述、整改要求、责任部门、整改期限、整改状态、完成时间。各单位提交的台账需统一映射至上述标准字段,确保数据规范统一。

第二步:技术实操流程,实现批量整合

由于需调用Python的pandas和openpyxl库,需提前完成环境配置(安装命令:pip install pandas openpyxl)。以下为完整操作代码,包含具体注释,可根据实际台账文件存放路径修改调整后直接运行。

python
# 1. 导入所需库
import pandas as pd
import os
# 2. 定义基础配置
# 台账存放文件夹路径(修改为你的实际路径,如"D:/审计整改/各单位台账")
file_path = "D:/审计整改/各单位台账"
# 标准化字段映射表(对应各单位可能的不同字段名)
standard_fields = {
    "问题编号": ["问题编号", "整改序号", "问题序号"],  # 所有可能的同义字段
    "问题描述": ["问题描述", "问题详情"],
    "整改要求": ["整改要求", "整改措施要求"],
    "责任部门": ["责任部门", "责任科室", "整改部门"],
    "整改期限": ["整改期限", "完成时限"],
    "整改状态": ["整改状态", "完成情况"],
    "完成时间": ["完成时间", "整改完成日期"]
}
# 3. 批量读取并整合台账
def merge_audit_tables(file_path):
    # 存储所有整合后的数据
    all_data = []
    # 遍历文件夹内所有Excel文件
    for filename in os.listdir(file_path):
        if filename.endswith(".xlsx") or filename.endswith(".xls"):
            # 读取单个Excel文件
            df = pd.read_excel(os.path.join(file_path, filename))
            # 标准化字段:将不同字段名统一替换为标准字段
            new_columns = []
            for col in df.columns:
                # 匹配标准字段
                matched = False
                for std_col, possible_cols in standard_fields.items():
                    if col in possible_cols:
                        new_columns.append(std_col)
                        matched = True
                        break
                # 非必要字段直接丢弃
                if not matched:
                    df = df.drop(columns=[col])
            df.columns = new_columns
            # 补充缺失的标准字段(若有单位未填写,填充为"待补充")
            for std_col in standard_fields.keys():
                if std_col not in df.columns:
                    df[std_col] = "待补充"
            # 日期格式标准化:统一转为"YYYY-MM-DD"格式
            date_fields = ["整改期限", "完成时限"]
            for date_col in date_fields:
                df[date_col] = pd.to_datetime(df[date_col], errors="coerce").dt.strftime("%Y-%m-%d").fillna("日期格式错误")
            # 添加来源单位字段(从文件名提取,如"市财政局整改台账.xlsx"提取"市财政局")
            df["来源单位"] = filename.replace("整改台账.xlsx", "").replace("整改台账.xls", "")
            # 将处理后的数据加入总列表
            all_data.append(df)
    # 合并所有单位数据
    merged_df = pd.concat(all_data, ignore_index=True)
    # 去重(删除完全重复的行)
    merged_df = merged_df.drop_duplicates()
    # 保存为汇总表
    merged_df.to_excel(os.path.join(file_path, "各单位整改台账汇总表.xlsx"), index=False)
    print(f"整合完成!共汇总{len(merged_df)}条整改记录,已保存为'各单位整改台账汇总表.xlsx'")
# 执行整合函数
merge_audit_tables(file_path)

第三步:整合后数据核查与修正

运用上述代码完成多部门整改台账整合后,为保障汇总数据的完整性、准确性,需开展针对性核查与修正工作。建议打开生成的“各单位整改台账汇总表.xlsx”,重点核查两类关键信息:一是标记为“待补充”的字段,此类字段对应各单位未填报的核心信息(如未提交“整改期限”“责任部门”等);二是显示为“日期格式错误”的日期字段,此类字段为格式转换失败的异常日期(如原台账中“2025/5/20”“20250520”等非标准格式未成功转换)。针对核查发现的缺失信息或异常日期,需及时联系对应被审计单位补充完善,确保汇总数据规范可用,为后续审计整改跟踪、总体评价奠定基础。

通过上述简单三步,成效显著:一是效率明显提升。完成20个单位的台账整合,人工操作需2小时以上,代码自动化处理仅需30秒,含前期配置在内总耗时不超过10分钟,大幅压缩工作时间;二是数据质量可控。通过代码实现字段标准化匹配与格式统一,有效避免人工录入的漏填、错填问题,确保数据准确无误;三是代码复用性强。代码核心逻辑可通用,后续同类台账汇总工作仅需调整文件路径,无需重复开发,降低技术应用门槛。

三、延伸优化:常见问题解决方案

针对实际工作中可能出现的特殊需求情况,整理两类高频情景的解决方案:

问题一:部分台账含多个工作表

解决方案:读取文件时添加sheet_name=None参数,实现多工作表批量读取。修改代码如下:df = pd.read_excel(文件路径, sheet_name=None),后续通过循环遍历各工作表数据,完成整合。

问题二:需要筛选逾期未整改记录

解决方案:在整合完成后添加筛选逻辑,如:# 筛选逾期未整改记录(假设整改状态为"未完成"且整改期限早于当前日期)import datetime today = datetime.date.today().strftime("%Y-%m-%d") overdue_df = merged_df[(merged_df["整改状态"]=="未完成") & (merged_df["整改期限"] < today)] overdue_df.to_excel("逾期未整改记录.xlsx", index=False)。

四、工作启示:技术赋能审计工作质效提升

推动审计整改数据化,需要立足工作实际痛点,以实用技术和工具破解流程难点。充分发挥Python语言基础简单易学易用的特点,无需深厚的编程知识,通过几十行标准化代码即可快速落地,既降低了技术应用门槛,又实现了工作成效的突破。下一步,我们将持续探索信息技术与审计工作各环节的深度融合,分享更多实用技术方法,助力审计质效不断提升。(起草人:杨雨非 审批人:徐峰)