《江苏省健康信息平台共享数据集》
工作笔记
为推进我省全民健康信息化建设、满足卫生健康业务信息系统建设互联互通、信息共享需要,及省基层卫生健康信息化提档升级工作的相关要求,省卫健委将采集各医院相关数据,并组织修订了一批医疗卫生服务相关数据标准。截止目前,已经对接省内三级医院208家;截至2020年底,已采集300亿条数据。
1.采集模式:医院各系统提供视图,数据采集公司通过采集工具从视图提取数据,然后推送到省平台中心库,省平台由东软集团搭建。由于采集工作量比较大等各种原因,采集任务分配给四家数据采集公司,分别是:北京锐软、无锡曼陀罗、江苏汇鑫、苏州环亚,每一家公司负责几个地市。
采集的流程大概如下图:
其中虚线中的临时库在省平台更新完采集工具后就不再使用了,直接从医院抓取到前置机上的东软临时库。

由于各个子系统不一定都能提供出完整的视图,例如检查报告表一般由PACS提供,但PACS系统中可能没有视图所需的医生身份证号,所以医院可能把多个子系统的数据提前先按照接口文档把数据拼接在一起,再统一上传到省平台。这种方式还有一个好处是可以对比医院生成的数据与省平台采集走的数据是否一致。
这种模式大概的流程如下图:

两个工具:
数据采集工具:
用来查看数据采集情况如采集中的报错信息,标准字典对照功能

数据治理平台
用来查看采集的数据的关联度


为了方便查看,细分各部分如下:









下图是接口文档的样式,每个表中都会记录表名、唯一号字段、采集规则字段和其他需要的字段。

唯一号字段:
唯一号字段是表中每一条记录的唯一id,不能重复。例如医嘱视图,如果唯一号字段是用病人ID号+住院次数+医嘱号来定义的,那么当存在一组医嘱的医嘱号相同而子序号不同时,就出现了两条医嘱内容的唯一ID号相同的主键冲突,这种情况下就要用病人ID号+住院次数+医嘱号+医嘱子序号来定义此字段或者直接按照文档中建议的用全球唯一码。
采集规则字段:
病案系统最后修改日期:如果把此最后修改日期作为pof_dt,就会出现一份病案上传两次以上的情况。
如果病案系统中有归档日期字段,则直接采用归档日期;如没有,则可以根据医院情况,假设要求5天内病案必须归档,可以用出院日期+7day作为视图的归档日期。
其他关联字段:
患者就诊卡证类型CARDTYPE
患者就诊卡证号码CARDNO
门诊/急诊/住院/体检标志OP_EM_HP_EX_MARK
门诊/急诊/住院/体检编号OP_EM_HP_EX_NO
这几个字段是大多数表互相关联都要用到的字段,各个厂商提供的视图要按照同一规则来定义。结对出现的表,比如处方主表与从表,检查申请表与报告表,还有特定的关联字段,如处方号或检查申请号。
各表的关键字段如下表:
部分
含义
表名
按**采集数据上传
主键
字段含义
字段名
字段含义
字段名
N_江苏卫生信息数据集(医疗门诊数据)
患者基本信息数据表结构
PersonalInformation
更新日期
UPDATE_DATE
患者唯一ID号
PERSONAL_ID
门诊/急诊挂号数据表结构
RegisterRecord
就诊日期
VISIT_DATE
挂号唯一ID号
REGISTOR_ID
门诊/急诊就诊记录表结构
MedicalRecord
就诊日期
VISIT_DATE
就诊记录唯一ID号
MED_REC_ID
门诊/急诊/住院西药处方表结构
WM_Prescriptions
开处方日期
RX_DT
处方唯一ID号
RX_ID
门诊/急诊/住院西药处方表结构(从表)
WM_PrescriptionDetails
开处方日期
RX_DT
处方用药唯一ID号
DRUG_ID
门诊/急诊/住院中药处方表结构(主表)
CM_Prescriptions
开处方日期
RX_DT
处方唯一ID号
RX_ID
门诊/急诊/住院中药处方表结构(从表)
CM_PrescriptionDetails
开处方日期
RX_DT
处方用药唯一ID号
DRUG_ID
O_江苏卫生信息数据集(医疗门诊数据)
患者入院记录表结构
InHospitalRecord
归档日期
POF_DT
入院唯一ID号
IN_HOS_ID
住院患者病程记录表结构
CourseRecord
归档日期
POF_DT
病程记录唯一ID号
PROGRESS_ID
患者出院/死亡记录表结构(出院小结)
OutHospitalRecord
归档日期
POF_DT
出院唯一ID号
OUT_HOS_ID
FirstPageMedicalRecord
归档日期
POF_DT
病案唯一ID号
MED_REC_ID
MR_OperationRecord
归档日期
POF_DT
病案中手术唯一ID号
MED_OP_ID
ED_CMEDICAL_HOME_PAGE_RECORD
归档日期
POF_DT
中医病案唯一ID号
MED_REC_ID
ED_CMED_HOME_PAGE_OPE_RECORD
归档日期
POF_DT
病案中手术唯一ID号
MED_OP_ID
住院病人医嘱表结构
DoctorAdviceRecord
出院日期
OUT_H_DATE
医嘱唯一ID号
ID
P_江苏卫生信息数据集(医疗门诊数据)
检验申请记录表结构
TestRecord
申请日期
APPLY_DT
检验申请唯一ID号
TEST_ID
检验报告记录表结构(主表)
LAR_EXAM_INFO
出具报告日期
RPT_DT
检验报告唯一ID号
SAMP_ID
检验结果明细表结构(从表)
TestDetails
出具报告日期
RPT_DT
检验结果唯一ID号
RESULT_ID
检查申请记录表结构
ExaminationRecord
申请日期
APPLY_DT
检查申请唯一ID号
EXAM_ID
检查报告记录表结构
ExaminationDetails
出具报告日期
RPT_DT
检查结果唯一ID号
RESULT_ID
Q_江苏卫生信息数据集(医疗门诊数据)
患者基本信息数据表结构
EMR_PATIENT_BASIC_INFORMATION
患者唯一ID号
PERSONAL_ID
门诊/急诊挂号数据表结构
EMR_REGISTERED_PATIENT_RECORD
挂号唯一ID号
REGISTOR_ID
门诊/急诊就诊记录表结构
EMR_OUTPATIENT_VISIT_RECORD
就诊记录唯一ID号
MED_REC_ID
急诊留观-观察病历表结构
EMR_OBSERVE_MEDICAL_RECORD
观察记录唯一ID号
OBS_REC_ID
急诊留观-观察病程记录表结构
EMR_OBSERVE_COURSE_RECORD
病程记录唯一ID号
COU_REC_ID
急诊留观-出观察室记录表结构
EMR_OUT_OBSERVE_ROOM_RECORD
记录唯一ID号
OUT_REC_ID
门急诊/观察室有创操作记录表结构
EMR_INVASIVE_OPERATION_RECORD
记录唯一ID号
OPE_REC_ID
门诊/急诊/住院西药处方表结构(主表)
EMR_WM_PRESCRIPTION_RECORD
处方唯一ID号
RX_ID
门诊/急诊/住院西药处方表结构(从表)
EMR_WESTERN_MEDICINE_RECORD
处方用药唯一ID号
DRUG_ID
门诊/急诊/住院中药处方表结构(主表)
EMR_CM_PRESCRIPTION_RECORD
处方唯一ID号
RX_ID
门诊/急诊/住院中药处方表结构(从表)
EMR_CHINESE_MEDICINE_RECORD
处方用药唯一ID号
DRUG_ID
R_江苏卫生信息数据集(医疗门诊数据)
手术/操作记录表结构
OperationRecord
手术/操作归档日期
POF_DT
手术唯一ID号
OPER_ID
治疗处置记录表结构
TreatmentRecord
记录日期
REC_DT
治疗唯一ID号
TREAT_ID
患者输血申请表结构(主表)
TransfusionRecord
申请日期
APPLY_DT
申请唯一ID号
APP_ID
患者输血记录表结构(从表)
TRANSFUSIONDETAILS
记录日期
REC_DT
输血唯一ID号
TB_ID
S_江苏卫生信息数据集(医疗门诊数据)
医疗高值耗材使用记录
ConsumptiveMaterialRecord
记录日期
REC_DT
使用耗材唯一ID号
SUPPLIES_ID
门诊/急诊/住院费用表结构(主表)
CostRecord
收费日期
RCD_DT
收费唯一ID号
CHARGE_ID
门诊/急诊/住院费用表结构(从表)
CostDetails
收费日期
RCD_DT
收费项目唯一ID号
CHARGE_PROJ_ID
T_江苏卫生信息数据集(医疗门诊数据)
医疗机构上传数据质控表结构
ED_Management_Table
上传数据日期
UPLOAD_DATE
唯一ID号
DATA_ID
入院出院患者统计数据表结构
ED_Adm_Dis_Statistics_Data
统计日期
STAT_DATE
唯一ID号
DATA_ID
门诊/住院收费统计数据表结构
ED_Outpa_Inpa_Charge_Stat
统计日期
STAT_DATE
唯一ID号
DATA_ID
门诊工作量统计数据表结构
OP_WORKLOAD
上传日期时间
UPLOAD_DT
报表唯一ID号
REP_ID
住院工作量统计数据表结构
IN_WORKLOAD
上传日期时间
UPLOAD_DT
报表唯一ID号
REP_ID
Z_江苏卫生信息数据集(医疗门诊数据)
药品入库信息记录表
Drug_In_Store_Infor_Record
入库日期
INSTORE_DATE
入库唯一编码
INSTORE_ID
药品出库信息记录表
Drug_Out_Store_Infor_Record
出库日期时间
OUTSTORE_DATE
出库唯一编码
OUTSTORE_ID
耗材入库信息记录表
Mater_In_Store_Infor_Record
入库日期
INSTORE_DATE
入库唯一编码
INSTORE_ID
耗材出库信息记录表
Mater_Out_Store_Infor_Record
出库日期时间
OUTSTORE_DATE
出库唯一编码
OUTSTORE_ID
按照接口文档做完视图,把关键字段定义好,接口框架就算搭建完成,下一步就是根据接口文档中的字段做细节的处理,需要标化的进行标化。
3.数据标化由于各个厂家系统内部的编码含义不同,直接采集的数据代码或文字无法用来做分析决策,因此要对数据进行标准化处理。根据《江苏省医疗信息分类编码标准集(2020年修订版)》与《江苏省健康信息平台共享数据集(医疗部分)(2020年修订版)》中的相关说明,有以下标准字典:
疾病字典
采用“疾病分类与代码国家临床版2.0”
手术字典
采用“手术操作分类代码国家临床版3.0”
区划字典
采用“国家统计局行政区划编码2017”
药品字典
采用“国家药品标准编码6.0江苏增补版”
草药字典
采用“江苏省中草药分类编码标准”
耗材字典
下发了Excel文件“江苏高值医用耗材编码.xls”
企业编码
下发Excel文件“企业编码20200525.xlsx”,内含药品生产企业、药品配送企业、耗材生产企业、耗材配送企业的统一社会信用代码
检查项目
采用“江苏省检查分类编码标准”
检验项目
采用“江苏省检验分类编码标准”
医疗费用类别
国籍代码
GB/T26592000
民族分类代码
GB/T3304-1991
从业状况分类
GB/
入住重症监护室(ICU)情况
指定了从01-99的含义
麻醉方法代码
就诊卡证类型
性别
1、男,2、女
门诊/急诊/住院/体检标志
1、门诊,2、急诊,3、住院,4、体检
江苏检验样本类型代码
见文档中表格
ABO血型类别代码
A型,2、B型,3、O型,4、AB型,5、不详
Rh类别标志
阴性,2、阳性
婚姻状况
GB/T4766-1984标准
家庭关系编码
GB/T4761标准
医疗费用支付方式
标准
文化程度代码
GB4658-2006
职业分类代码
GB/T6565-2015
国家科室分类代码
见文档中表格
纳入慢病管理分类代码
见文档中表格
江苏疫区接触史代码表
见文档中表格
监测症状代码表(临床版2.0)
见文档中表格
是否
1是,0否
有无
1有,0无
江苏处方分类代码表
见文档中表格
药品剂型分类代码
见文档中表格
江苏药品使用频率代码表
见文档中表格
用药途径代码表
江苏中药使用方法代码表
见文档中表格
江苏中药服药频次代码表
见文档中表格
江苏中药煎煮方法代码表
见文档中表格
治疗处置项目分类代码
见文档中表格
血液品种分类代码
见文档中表格
江苏医疗收费监管分类代码
见文档中表格
江苏医疗收费财务分类代码
见文档中表格
接口视图中需要标化的字段,要转化成标准代码。转化方式基本是两种方案:①字段数据量小的字典如性别字典可直接使用decode关键字做转换,男-1,女-2;②数据量大的字典,需要创建对照表,做对照功能,在视图中根据对照关系做转换。省平台更换采集工具之前,是需要在院内的各个子系统做对照模块,视图中转换;更换采集工具之后,统一在平台上做对照,在视图中就不需要转化了。
4.结束语