基于真实世界研究的淋巴瘤研究数据库建设与应用

(整期优先)网络出版时间:2023-03-15
/ 1
摘要目的针对临床数据数量庞大和质量差的现状,本研究旨在以建立淋巴瘤研究数据库为例,探索高质量研究数据库的建立路径以及在真实世界研究的作用。方法汇总研究领域专家意见,参考相关指南和标准,建立标准医学知识库;回顾性抽取2005年2月-2021年12月期间就诊于北京大学肿瘤医院淋巴瘤患者电子诊疗数据,采用深度学习、自然语言处理等方式,搭建"基于电子病历系统的淋巴瘤数据库-生物样本信息库-延伸遗传信息库"的动态智能信息整合与处理系统。结果研究数据库在满足了临床科研人员的研究需求的同时,实现医院病历数据和生物样本信息数据的申请、审批、溯源和分析全过程留痕管理。数据库中核心科研变量总数为668个,结构化变量占46.0%。截至2021年12月25日,数据库中共有淋巴瘤患者68 687人,男女患者人数比值为8/9,就诊次≥3次的患者占比为23.0%。此外,研究者可在数据库中根据目标条件叠加检索,显示命中的就诊记录,建立研究队列,进行统计建模,挖掘数据信息。结论通过整合管理流程和利用自然语言人工智能新技术建立循证等级高的数据库,有助于医院信息系统的互联互通与资源共享,从而达到为开展真实世界研究提供可靠详实数据的目的。