说到科研数据队列,就一定绕不开谈及Framingham心脏研究。
1930—1950年间,心血管疾病在美国迅速增长,成为影响众多美国民众健康的心头大患。在当时,心脏病和卒中的病因不为人知,甚至在大部分美国人看来,死于心脏病是不可避免的。和无数美国民众一样,罗斯福总统也难逃心血管疾病,于1945年去世。
1948年,美国联邦政府赞助美国国立心脏、肺和血液研究所启动了Framingham心脏研究。自此,横跨大半个世纪的Framingham心脏研究通过与时俱进的发展模式开展了高质量随访,建立了多代群体队列,并最终产出了包括“高血压、高血脂血症增加冠心病危险”在内的2600余项重大科研成果。
时至今日,诸如SEER、TARGRT、TCGA和HRS等公共医疗数据队列和数据库蓬勃发展,越来越多影响医学发展的重大科研成果也在不断产出。
数据队列对科研成果产出的价值不言而喻。
随着精准治疗的高速发展、多组学研究的全面普及,以及研究数据样本的剧增,专业的科研数据库平台声名鹊起,逐渐成为辅助队列建设和长期发展,以及科研成果高效高质产出的重要工具。
科研数据库的建设需求基本可分为两大类,一是数据沉淀需求,通过积累数据资产,为尚未明确的研究课题和研究方向做探索准备,如医院对积累患者多组学数据的需求、申办方对积累临床研究数据资产的需求,以及积累医患管理数据的需求等;二是临床研究需求,如辅助已明确方向和课题的IIT研究、IST研究完成定向数据治理、质控、锁定和应用等相关工作。
在需求驱动下,科研数据库延伸出两种经典产品形态——专病库与EDC,并逐渐朝着一体化的方向发展。从部署形态来看,科研数据库或为多中心协作平台,或为或医院本地部署,在定位、特性、适用项目和平台权限上不尽相同。
2014年前后,随着零氪科技等创新型医疗大数据公司的兴起,科研数据库的部署建设朝着强平台能力和强科研服务导向转变,在技术团队搭建、数据治理、数据安全体系和质量管理体系建设、多中心平台和体系搭建、科研人才吸纳,以及临床协作、录入和监察、随访、数据管理等专业细分团队建设等方面不断完善,以科研为导向,以技术为驱动,以人才协同发展,开展了一系列实践探索,为科研数据库建设积累了一定经验。
例如,某省肿瘤医院妇科大病区每年收治数千例的宫颈癌、子宫内膜癌、卵巢癌等妇科恶性肿瘤新发病例,诊疗数据均存储在该院业务系统中,没有统一的标准规范和格式,且为非科研所需的结构化数据,对临床医生精准定位患者群体和统计分析数据产生了不利影响。在此背景下,该院与零氪科技合作搭建本地专病库,改善了群体定位能力和科研效率,降低了数据处理成本,提供了更多科研可能性。此外,该项目还反哺临床场景,帮助实现院内病历质量提升,增强规范诊疗能力。目前该专病库合作项目还与多中心数据库协作,将本地数据安全合规脱敏后,参与到多中心数据库共建之中。
此外,专病库平台建设方与研究团队合作产出科研成果,也已成为科研数据库价值实现的成熟模式。
如北肿柯杨教授带领团队与零氪合作,采用多中心真实世界队列研究设计,基于南、北方两家肿瘤专科医院的近6000例食管鳞癌根治术后患者多维度临床大数据,及长达10年的生存随访结果,围绕“微创手术治疗局部食管鳞癌的效果及安全性”“食管鳞癌患者根治术后总生存的预测模型”分别开展了两项真实世界研究,助力食管鳞癌大样本RWE产出,相关研究已发表于Annals of surgery(IF:12.96)。
除科研价值外,科研数据库也在探索更多创新价值的可能性。
一是探索科研数据库在诊疗数据洞察中的价值,如开展临床诊疗现状的多维度解析、洞察诊疗宏观趋势,以及真实反映临床诊疗规范等。
在这方面,零氪已有相关探索。如2016年起,零氪科技联合相关机构共同发布的“中国肿瘤患者就诊迁徙图”,揭示了肿瘤患者在中国的就诊迁徙情况,展示了我国肿瘤治疗资源配置、地域经济状态的不同而呈现的较大差异。
二是探索科研数据库在临床精准管理上的价值,如将其应用于精准患者教育、数字疗法&电子药,以及病历质量精准质控等,包括通过结构化的科研数据队列,依据标签精准推送患者教育内容等。
三是探索成为智能辅助工具的基础,如通过CDSS(临床决策支持系统)推荐个性化诊疗方案,以及智能推荐科研方向、智能精准患者招募等。
举例来说,临床和科研人员的诊疗数据与行为数据特征,均可以被系统标注为潜在的科研方向,当这些特征数据与内置知识库特征相匹配后,即可为临床医生或科研人员推荐、匹配其感兴趣的科研方向。
从数据到价值创新,科研数据库在如何挖掘数据价值、如何提升科研数据利用水平、如何拓展更多创新价值等方面,提出了新的、更高的要求。
未来,随着医疗信息化建设的进步,科研数据库的功能需求及支撑技术也将进一步发展,加快打通“数据”到价值创新的实现路径,发挥更大价值。
(来源:新视线)