首发于 深度学习练习屋
初探医疗知识图谱

初探医疗知识图谱

知识图谱是智能大数据的前沿研究问题,它以独有的技术优势顺应了信息化时代的发展。同时随着智能时代的到来,把临床数据、临床指南、组学数据通过大数据和知识图谱结合,核心医学概念的全面覆盖、医疗生态圈内全方位知识数据的聚合,构建综合智能医疗系统,给临床医生、患者和科研工作者等提供帮助,成为未来医疗的发展方向。因此如何将AI+医疗在工业界快速落地,构建一个简单实用、可扩展的医疗知识图谱是目前关注的话题。

本文针对中文医疗知识图谱,从产品和技术等方面进行简单的分析和概括,为后续的工程化实践做准备。

1. 工业界医疗知识图谱相关产品

百度-灵医智惠

灵医智惠是由百度大脑技术驱动的AI医疗品牌。灵医智惠技术中台以医学数据结构化及医学知识图谱为基础,构建多项医疗专项能力,覆盖临床、科研、管理、患者服务等多环节

灵医智惠技术中台
灵医智惠“爱助医”解决方案整体架构

以灵医智惠“爱助医”为例,该产品能提供医学知识服务、临床辅助决策、智能随访服务和区域健康驾驶舱等四项核心应用,且服务范围辐射院内、院外和区域三大场景。在临床辅助决策方面,通过学习海量教材临床指南药典及三甲医院优质病历,基于百度自然语言处理、知识图谱等多种AI技术,打造遵循循证医学的临床辅助决策系统,用以提升医疗质量,降低医疗风险。包含辅助问诊辅助诊断治疗方案推荐医学知识查询等多种功能

辅助诊断:基于主诉、现病史中提到的症状、疾病,以及体格检查、检验结果推荐相关的疾病、相关症状及体征,按照诊断结果由高到低推断潜在疾病可能性,实时抓取信息并提示,涵盖4000余种常见病,且全病种Top 3推荐准确率89%
相似病历推荐:基于病历文书实时分析,帮助临床医生从历史病例特点、诊疗方法、治疗效果中学习及借鉴诊疗思路。全病种Top 3历史病例匹配准确率89%
医学知识查询:通过认知计算、知识推理等技术通过查询关键词提供候选知识列表。所有知识来源均来自可循证的权威知识书籍、临床指南、药品说明书等,为医务人员提供实时可靠的医学知识,其中精选疾病知识9700+,典型病例3600+,国家临床路径1200+,医学词典17万+,医学计算器270+,心电图760+,临床检验330+,多维临床决策知识2600+

灵医智惠包括临床辅助决策、医疗大数据解决方案、眼底影响分析和智能诊前助手四大模块。医疗大数据解决方案专注于使用NLP和知识图谱技术对电子病历进行多层级深层次的结构化。智能诊前助手是基于专业医疗知识图谱,采用多种算法模型与多轮智能交互理解病人病情,根据病人病情精准匹配就诊科室和专业医生。

医疗大数据解决方案

从上述简介可知,不论是构建还是应用,百度灵医智惠都侧重于建设电子病历。结构化良好的病历是构建整个智能系统的基石。

中国平安-平安好医生

2019年平安智慧医疗正式推出中文医疗知识图谱。该图谱集成了60万医学概念、530万医学关系、千万医学证据,覆盖核心医学概念。

平安医疗知识图谱实例
平安知识图谱整体架构

从上图可以看出,整个知识图谱体系分为四层:

数据层:数据源主要来自于医学领域核心概念及丰富的临床证据,并通过RWE(真实世界证据)和经典病例分析形成医学知识
图谱构建:使用知识图谱及NLP相关技术来构建图谱
数据平台:完成数据的获取、清洗处理、存储和分析
智能服务:提供可视化、问答、决策等服务

目前基于此医疗知识图谱和更多的数据源,平安医疗开发出多个智能服务的应用场景,组件了医疗科技平台。以旗下的平安好医生'AI辅助诊疗系统'为例,通过智能语音语义解析及大数据等技术赋能,集合了超过3亿条在线诊疗及健康咨询数据,用于在线医疗咨询的预诊分诊、问诊等环节。

平安医疗科技平台架构

阿里巴巴-阿里健康

2018年阿里健康推出基于知识图谱打造的知识库——医知鹿。“医知鹿”属于一项公益类项目,知识库的内容由顶级医学专家、多家医疗机构和数百名医生所编写,首版收录了近百个常见病种和12个高发实体肿瘤或罕见病的预防治疗知识。医知鹿的目标人群主要为患者,将教科书式的医学知识和治疗方案解读成患者易懂、实用的内容。

医知鹿APP示例

此外,阿里健康还拥有一款智能医疗系统——Doctor You。目前Doctor You系统包括临床医学科研辅助平台、医疗人工智能开放平台以及临床医师技能训练平台等。

  1. 临床医学科研辅助平台

该系统是以智能搜索为主的大数据科研辅助分析引擎,通过数据仓库、数据挖掘等方法,用海量临床科研数据来评价治疗效果,发现诊疗规律,提炼最佳治疗路径,提高医疗科研的能力和水平。其科研数据平台包括:

知识图谱:通过建立病历研究专题相关的百科知识图谱,如疾病介绍、症状介绍等。构建诊疗之间的关系,例如:

自然语言处理:信息系统中存在很多次的同义词情况,比如冠心病、冠状动脉粥样硬化之类的词。利用自然语言处理算法,在结构化数据的同时,根据词向量形成同义词簇,由人工参与后,确认同义词之间的关系,形成确定的、准确的同义词词库

机器学习:提供一站式数据挖掘流程,数据上云之后,无需做任何线下处理即可实现业务逻辑。提供了数据预处理、自然语言处理、特征工程、机器学习算法、预测和评估、在线预测这一套流程的全部组件

2. 医疗人工智能开放平台

该系统提供医疗AI建模、训练及开放应用服务,针对医疗机构真实临床场景,提供智能肺、乳腺X射线、肿瘤靶区勾勒等多部位、多病种医学AI系统应用及糖尿病用药、宫颈癌筛查等AI辅助诊断决策系统应用平台。

文本科研平台影像科研平台相融合,使用AutoML特征工程等算法建立科研模型,实现多部位、多病种的筛查应用

医疗人工智能开放平台

腾讯-觅影

腾讯觅影发布AI辅诊开放平台,旨在依托觅影在医疗领域积累的医学知识图谱、诊断模型、病情理解、名医专家库等AI辅诊基础能力,提供疾病预测、辅助决策、数据分析等功能。

辅诊开放平台

疾病预测功能旨在多方位帮助医生减轻工作量、辅助医生临床诊断。疾病预测由三个模块构成:

病案管理示例

康夫子-左手医生

通过建立“医疗大脑”知识图谱,康夫子推出了左手医生开放平台和面向C端用户的左手医生APP。左手医生系统的技术架构核心主要由三部分组成:

左手医生开放平台主要面向医院提供多种服务,包括"用药管家”、“智能导诊”、“智能问答”、“智能自诊”等多种功能。

智能导诊:解决患者盲目就医,减轻导诊台工作压力,有效提升患者就医体验。疾病预判覆盖32个学科,2000+种疾病
智能问答:基于权威医学知识库,解决患者医疗、健康类咨询需求,涵盖了人民卫生出版社全部医学类书籍内容及药品说明书等,保证了数据的准确性和权威性。
智能自诊:基于患者病情,动态计算后自动生成下一个问题,模拟医患真实对话流,同时根据多层贝叶斯网络模型,输出基于概率的诊断,最后根据需要还可以显示诊断对应的检查、化验、用药等信息
智能导诊、智能问答、智能自诊


丁香园

丁香园为医生、医学生及其他医疗从业者提供一个信息交流的平台,同时也推出了一系列移动产品以提供优质的医学信息服务,包括丁香园论坛、用药助手、丁香医生、丁香家商场等

丁香医生疾病查询

丁香园的AI系统主要以NLP中语义理解和搜索为主导,其技术架构包括三个方面:

丁香园知识图谱
丁香园内容画像
短文本理解技术

2. 学术界医疗知识图谱——CMeKG

CMeKG(Chinese Medical Knowledge Graph)是利用自然语言处理与文本挖掘技术,基于大规模医学文本数据,以人机结合的方式研发的中文医学知识图谱。CMeKG 的构建参考了ICD、ATC、SNOMED、MeSH等权威的国际医学标准以及规模庞大、多源异构的临床指南、行业标准、诊疗规范与医学百科等医学文本信息。CMeKG 涵盖疾病的临床症状、发病部位、药物治疗、手术治疗、等30余种常见关系类型,CMeKG 描述的概念关系实例及属性三元组达100余万。

CMeKG搜索示例

除此以外在OpenKG上也有一些开源的医疗知识图谱:

3. 医疗知识图谱概述

3.1 数据源

目前医疗知识图谱构建的数据源可以分为三个部分:

1. 权威的医学文献:包括医学数据、医疗指南、论文等

2. 临床数据:包括电子病历、影像、检验等一大堆专业临床业务系统产生的数据集

3. 互联网信息:包括医疗资讯、问答数据等

3.2 医疗知识图谱构建

知识图谱的构建可以归纳为五个步骤,即知识的表示、抽取、融合、推理以及质量评估,而对于医疗领域来说,前三步为核心步骤:

1. 医学知识表示

知识图谱本体的表示可以提升数据的整合能力,便于下游的知识推理任务,而在工业界中通常并没有采用严格意义上的Ontology来进行表示,而是根据不同的医学信息标准并结合底层数据的内容来设计适用于产品化的Schema,例如目前普遍适用的概念性层级网络,其中包含着许多"上下位词"的关系,这样的组织结构不如传统意义上的本体语言那么严格,也很难进行本体推理,但是能够简单而有效的表达领域知识。在构建过程中大多采用半监督和无监督的方法来获取概念之间的关系。

在医疗领域,实体维度通常包括疾病、症状、检查、检验、体征、药品等等医学名词,甚至医生、科室、医院也可以纳入范畴。关系是指实体间的关系,比如,针对疾病和症状,关系可有“包含关系”,“不包含关系”,甚至“金标准关系”(比如,所有炎症都会带来发热)。

医学知识的表示首先应当符合医学领域的严肃性,要求知识的准确率高,在构建过程中医学从业者的指导与必不可少,同时医学知识的表示也要兼顾下游任务的实用性和通用性,使其能够与诊断模型、问答系统等紧密结合。

2. 知识抽取

知识抽取包括实体、关系和属性抽取。然而与其他垂直领域相比,医学知识抽取存在着数据差异性较大、人工标注的专业性要求高和实体嵌套等诸多难点,因此工业界和学术界都在不断研究一些特有的医学知识抽取的方法,后续会进行详细的探讨和实践。

3. 知识融合

知识融合使不同来源的知识在同一框架规范下进行数据整合、消歧和加工。不同医学标准下实体的描述可能会不尽相同,同时医学实体在不同的数据源中存在严重的多元指代问题,例如阿奇霉素在百度百科中被称为希舒美,在 A+医学百科中别名有阿齐霉素、阿奇红霉素、叠氮红霉素等。因此实体对齐是医学知识融合中非常重要的一步。

3.3 医疗知识图谱的应用

从以上介绍中可以看出,目前医疗知识图谱的落地应用主要分为一下几个方向:

  1. 临床决策支持系统

辅助决策系统即通常所谓的CDSS系统,即借助医疗知识图谱,医疗决策支持系统可以根据患者症状描述及化验数据,给出智能诊断、治疗方案推荐及转诊指南,即所谓的诊前决策、诊中决策和诊后决策三大应用场景,例如上述提到“智能导诊”、“智能问诊”等,同时该系统还可以针对医生的诊疗方案进行分析、查漏补缺,减少甚至避免误诊,例如腾讯觅影的风险监控。

临床决策支持系统的开发难度较大,其核心组件为知识库、推理机和人机交互系统

  • 知识库通常以知识图谱的形式来构建,因此对知识图谱的完备性和质量要求较高,能够覆盖足够多的疾病和症状才能进行诊断
  • 推理机一般称为“诊断模型”,对相应的医学知识进行推理做出决策。采用人工构建规则的方式质量较高但很低效,如何通过机器自动学习知识正是CDSS的难点所在。
  • 人机交互系统需要NLP的技术来实现,主要包括问答系统、语义解析、语音识别等

2. 信息检索系统

医疗信息检索包括问答系统和搜索引擎,其面向对象有患者和医疗从业者等。

  • 医疗信息搜索引擎:基于知识图谱的搜索引擎与传统的搜索引擎相比能够更好的理解用户的语义,优化用户的问句,根据知识图谱对query进行扩展和改写。以最具有代表性的丁香园为例,其面向医生、医疗机构、医药从业者,提供医疗知识的交流与检索,目前已经取得了不错的效果。
  • 医疗问答系统:面向患者的医疗问答系统最常见的功能是对患者提供医学知识的科普,以结构化的知识为主,例如“白内障是什么”、“什么是近视”。面向医疗从业者的问答系统主要功能是辅助教育,提供精准的结构化知识查询,同时也可以辅助科研任务,例如阿里的临床医学科研辅助平台。

4. 总结

目前知识图谱在医疗领域的落地应用已经取得一定的成果,推进了医学数据的自动化与智能化处理,为医疗行业带来新的发展契机。从海量医学数据中提炼出知识,对其加工处理,结合大数据、自然语言处理等技术组建一套强大的技术架构是目前很多企业的研究方向。本文只是简单的介绍了目前医疗知识图谱相关内容,为后续的工作做准备,对于各个环节所涉及到的具体技术今后再做深入的学习和实践。

哆哆女性网酒店个体工商户怎么起名互联网营销推广策略研究秦姓名字女生起名东莞网站网站优化三个字劳务公司起名字大全做网站建设多少钱从八字看起名网站建设 外贸姓毛起名男孩名字大全名字的四字起名解决梦遗精夏邑市酒店启怎么起名字模板 网站建设工作周公解梦大全查询买地河南商丘宁陵起名字陈华什么装饰材料公司起名参考沙雕qq签名做粮食的公司起什么名好周周易起名在线起名打分房山区网站建设学校网站优化属鼠李姓起名大全关于设计ppt网站深圳区号多少周易作者介绍小孩起名字 五行林宛瑜生病淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化