《江苏省健康信息平台共享数据集》

工作笔记

为推进我省全民健康信息化建设、满足卫生健康业务信息系统建设互联互通、信息共享需要,及省基层卫生健康信息化提档升级工作的相关要求,省卫健委将采集各医院相关数据,并组织修订了一批医疗卫生服务相关数据标准。截止目前,已经对接省内三级医院208家;截至2020年底,已采集300亿条数据。

1.采集模式:

医院各系统提供视图,数据采集公司通过采集工具从视图提取数据,然后推送到省平台中心库,省平台由东软集团搭建。由于采集工作量比较大等各种原因,采集任务分配给四家数据采集公司,分别是:北京锐软、无锡曼陀罗、江苏汇鑫、苏州环亚,每一家公司负责几个地市。

采集的流程大概如下图:

其中虚线中的临时库在省平台更新完采集工具后就不再使用了,直接从医院抓取到前置机上的东软临时库。


由于各个子系统不一定都能提供出完整的视图,例如检查报告表一般由PACS提供,但PACS系统中可能没有视图所需的医生身份证号,所以医院可能把多个子系统的数据提前先按照接口文档把数据拼接在一起,再统一上传到省平台。这种方式还有一个好处是可以对比医院生成的数据与省平台采集走的数据是否一致。

这种模式大概的流程如下图:


两个工具:

数据采集工具:

用来查看数据采集情况如采集中的报错信息,标准字典对照功能


数据治理平台

用来查看采集的数据的关联度


采集内容概述


为了方便查看,细分各部分如下:










关键字段

下图是接口文档的样式,每个表中都会记录表名、唯一号字段、采集规则字段和其他需要的字段。


唯一号字段:

唯一号字段是表中每一条记录的唯一id,不能重复。例如医嘱视图,如果唯一号字段是用病人ID号+住院次数+医嘱号来定义的,那么当存在一组医嘱的医嘱号相同而子序号不同时,就出现了两条医嘱内容的唯一ID号相同的主键冲突,这种情况下就要用病人ID号+住院次数+医嘱号+医嘱子序号来定义此字段或者直接按照文档中建议的用全球唯一码。

采集规则字段:

病案系统最后修改日期:如果把此最后修改日期作为pof_dt,就会出现一份病案上传两次以上的情况。

如果病案系统中有归档日期字段,则直接采用归档日期;如没有,则可以根据医院情况,假设要求5天内病案必须归档,可以用出院日期+7day作为视图的归档日期。

其他关联字段:

患者就诊卡证类型CARDTYPE

患者就诊卡证号码CARDNO

门诊/急诊/住院/体检标志OP_EM_HP_EX_MARK

门诊/急诊/住院/体检编号OP_EM_HP_EX_NO

这几个字段是大多数表互相关联都要用到的字段,各个厂商提供的视图要按照同一规则来定义。结对出现的表,比如处方主表与从表,检查申请表与报告表,还有特定的关联字段,如处方号或检查申请号。

各表的关键字段如下表:

部分

含义

表名

按**采集数据上传

主键

字段含义

字段名

字段含义

字段名

N_江苏卫生信息数据集(医疗门诊数据)

患者基本信息数据表结构

PersonalInformation

更新日期

UPDATE_DATE

患者唯一ID号

PERSONAL_ID

门诊/急诊挂号数据表结构

RegisterRecord

就诊日期

VISIT_DATE

挂号唯一ID号

REGISTOR_ID

门诊/急诊就诊记录表结构

MedicalRecord

就诊日期

VISIT_DATE

就诊记录唯一ID号

MED_REC_ID

门诊/急诊/住院西药处方表结构

WM_Prescriptions

开处方日期

RX_DT

处方唯一ID号

RX_ID

门诊/急诊/住院西药处方表结构(从表)

WM_PrescriptionDetails

开处方日期

RX_DT

处方用药唯一ID号

DRUG_ID

门诊/急诊/住院中药处方表结构(主表)

CM_Prescriptions

开处方日期

RX_DT

处方唯一ID号

RX_ID

门诊/急诊/住院中药处方表结构(从表)

CM_PrescriptionDetails

开处方日期

RX_DT

处方用药唯一ID号

DRUG_ID

O_江苏卫生信息数据集(医疗门诊数据)

患者入院记录表结构

InHospitalRecord

归档日期

POF_DT

入院唯一ID号

IN_HOS_ID

住院患者病程记录表结构

CourseRecord

归档日期

POF_DT

病程记录唯一ID号

PROGRESS_ID

患者出院/死亡记录表结构(出院小结)

OutHospitalRecord

归档日期

POF_DT

出院唯一ID号

OUT_HOS_ID

FirstPageMedicalRecord

归档日期

POF_DT

病案唯一ID号

MED_REC_ID

MR_OperationRecord

归档日期

POF_DT

病案中手术唯一ID号

MED_OP_ID

ED_CMEDICAL_HOME_PAGE_RECORD

归档日期

POF_DT

中医病案唯一ID号

MED_REC_ID

ED_CMED_HOME_PAGE_OPE_RECORD

归档日期

POF_DT

病案中手术唯一ID号

MED_OP_ID

住院病人医嘱表结构

DoctorAdviceRecord

出院日期

OUT_H_DATE

医嘱唯一ID号

ID

P_江苏卫生信息数据集(医疗门诊数据)

检验申请记录表结构

TestRecord

申请日期

APPLY_DT

检验申请唯一ID号

TEST_ID

检验报告记录表结构(主表)

LAR_EXAM_INFO

出具报告日期

RPT_DT

检验报告唯一ID号

SAMP_ID

检验结果明细表结构(从表)

TestDetails

出具报告日期

RPT_DT

检验结果唯一ID号

RESULT_ID

检查申请记录表结构

ExaminationRecord

申请日期

APPLY_DT

检查申请唯一ID号

EXAM_ID

检查报告记录表结构

ExaminationDetails

出具报告日期

RPT_DT

检查结果唯一ID号

RESULT_ID

Q_江苏卫生信息数据集(医疗门诊数据)

患者基本信息数据表结构

EMR_PATIENT_BASIC_INFORMATION

患者唯一ID号

PERSONAL_ID

门诊/急诊挂号数据表结构

EMR_REGISTERED_PATIENT_RECORD

挂号唯一ID号

REGISTOR_ID

门诊/急诊就诊记录表结构

EMR_OUTPATIENT_VISIT_RECORD

就诊记录唯一ID号

MED_REC_ID

急诊留观-观察病历表结构

EMR_OBSERVE_MEDICAL_RECORD

观察记录唯一ID号

OBS_REC_ID

急诊留观-观察病程记录表结构

EMR_OBSERVE_COURSE_RECORD

病程记录唯一ID号

COU_REC_ID

急诊留观-出观察室记录表结构

EMR_OUT_OBSERVE_ROOM_RECORD

记录唯一ID号

OUT_REC_ID

门急诊/观察室有创操作记录表结构

EMR_INVASIVE_OPERATION_RECORD

记录唯一ID号

OPE_REC_ID

门诊/急诊/住院西药处方表结构(主表)

EMR_WM_PRESCRIPTION_RECORD

处方唯一ID号

RX_ID

门诊/急诊/住院西药处方表结构(从表)

EMR_WESTERN_MEDICINE_RECORD

处方用药唯一ID号

DRUG_ID

门诊/急诊/住院中药处方表结构(主表)

EMR_CM_PRESCRIPTION_RECORD

处方唯一ID号

RX_ID

门诊/急诊/住院中药处方表结构(从表)

EMR_CHINESE_MEDICINE_RECORD

处方用药唯一ID号

DRUG_ID

R_江苏卫生信息数据集(医疗门诊数据)

手术/操作记录表结构

OperationRecord

手术/操作归档日期

POF_DT

手术唯一ID号

OPER_ID

治疗处置记录表结构

TreatmentRecord

记录日期

REC_DT

治疗唯一ID号

TREAT_ID

患者输血申请表结构(主表)

TransfusionRecord

申请日期

APPLY_DT

申请唯一ID号

APP_ID

患者输血记录表结构(从表)

TRANSFUSIONDETAILS

记录日期

REC_DT

输血唯一ID号

TB_ID

S_江苏卫生信息数据集(医疗门诊数据)

医疗高值耗材使用记录

ConsumptiveMaterialRecord

记录日期

REC_DT

使用耗材唯一ID号

SUPPLIES_ID

门诊/急诊/住院费用表结构(主表)

CostRecord

收费日期

RCD_DT

收费唯一ID号

CHARGE_ID

门诊/急诊/住院费用表结构(从表)

CostDetails

收费日期

RCD_DT

收费项目唯一ID号

CHARGE_PROJ_ID

T_江苏卫生信息数据集(医疗门诊数据)

医疗机构上传数据质控表结构

ED_Management_Table

上传数据日期

UPLOAD_DATE

唯一ID号

DATA_ID

入院出院患者统计数据表结构

ED_Adm_Dis_Statistics_Data

统计日期

STAT_DATE

唯一ID号

DATA_ID

门诊/住院收费统计数据表结构

ED_Outpa_Inpa_Charge_Stat

统计日期

STAT_DATE

唯一ID号

DATA_ID

门诊工作量统计数据表结构

OP_WORKLOAD

上传日期时间

UPLOAD_DT

报表唯一ID号

REP_ID

住院工作量统计数据表结构

IN_WORKLOAD

上传日期时间

UPLOAD_DT

报表唯一ID号

REP_ID

Z_江苏卫生信息数据集(医疗门诊数据)

药品入库信息记录表

Drug_In_Store_Infor_Record

入库日期

INSTORE_DATE

入库唯一编码

INSTORE_ID

药品出库信息记录表

Drug_Out_Store_Infor_Record

出库日期时间

OUTSTORE_DATE

出库唯一编码

OUTSTORE_ID

耗材入库信息记录表

Mater_In_Store_Infor_Record

入库日期

INSTORE_DATE

入库唯一编码

INSTORE_ID

耗材出库信息记录表

Mater_Out_Store_Infor_Record

出库日期时间

OUTSTORE_DATE

出库唯一编码

OUTSTORE_ID

按照接口文档做完视图,把关键字段定义好,接口框架就算搭建完成,下一步就是根据接口文档中的字段做细节的处理,需要标化的进行标化。

3.数据标化

由于各个厂家系统内部的编码含义不同,直接采集的数据代码或文字无法用来做分析决策,因此要对数据进行标准化处理。根据《江苏省医疗信息分类编码标准集(2020年修订版)》与《江苏省健康信息平台共享数据集(医疗部分)(2020年修订版)》中的相关说明,有以下标准字典:

疾病字典

采用“疾病分类与代码国家临床版2.0”

手术字典

采用“手术操作分类代码国家临床版3.0”

区划字典

采用“国家统计局行政区划编码2017”

药品字典

采用“国家药品标准编码6.0江苏增补版”

草药字典

采用“江苏省中草药分类编码标准”

耗材字典

下发了Excel文件“江苏高值医用耗材编码.xls”

企业编码

下发Excel文件“企业编码20200525.xlsx”,内含药品生产企业、药品配送企业、耗材生产企业、耗材配送企业的统一社会信用代码

检查项目

采用“江苏省检查分类编码标准”

检验项目

采用“江苏省检验分类编码标准”

医疗费用类别

国籍代码

GB/T26592000

民族分类代码

GB/T3304-1991

从业状况分类

GB/

入住重症监护室(ICU)情况

指定了从01-99的含义

麻醉方法代码

就诊卡证类型

性别

1、男,2、女

门诊/急诊/住院/体检标志

1、门诊,2、急诊,3、住院,4、体检

江苏检验样本类型代码

见文档中表格

ABO血型类别代码

A型,2、B型,3、O型,4、AB型,5、不详

Rh类别标志

阴性,2、阳性

婚姻状况

GB/T4766-1984标准

家庭关系编码

GB/T4761标准

医疗费用支付方式

标准

文化程度代码

GB4658-2006

职业分类代码

GB/T6565-2015

国家科室分类代码

见文档中表格

纳入慢病管理分类代码

见文档中表格

江苏疫区接触史代码表

见文档中表格

监测症状代码表(临床版2.0)

见文档中表格

是否

1是,0否

有无

1有,0无

江苏处方分类代码表

见文档中表格

药品剂型分类代码

见文档中表格

江苏药品使用频率代码表

见文档中表格

用药途径代码表

江苏中药使用方法代码表

见文档中表格

江苏中药服药频次代码表

见文档中表格

江苏中药煎煮方法代码表

见文档中表格

治疗处置项目分类代码

见文档中表格

血液品种分类代码

见文档中表格

江苏医疗收费监管分类代码

见文档中表格

江苏医疗收费财务分类代码

见文档中表格

接口视图中需要标化的字段,要转化成标准代码。转化方式基本是两种方案:①字段数据量小的字典如性别字典可直接使用decode关键字做转换,男-1,女-2;②数据量大的字典,需要创建对照表,做对照功能,在视图中根据对照关系做转换。省平台更换采集工具之前,是需要在院内的各个子系统做对照模块,视图中转换;更换采集工具之后,统一在平台上做对照,在视图中就不需要转化了。

4.结束语