OMAHA中文医学知识图谱模型(OMAHA Schema)构建路径



OMAHA中文医学知识图谱模型(OMAHA Schema)构建路径

2022-08-23 21:00 来源: 本地红姐晓天下

原标题:OMAHA中文医学知识图谱模型(OMAHA Schema)构建路径

健康医疗信息互操作与数据挖掘的基础是让计算机读懂医学语言,即医学语义理解。研制一个医学领域知识图谱模型用以指导中文知识图谱的构建,对于推进医疗信息化行业向“智能化”发展至关重要。OMAHA在对国际已有医学知识图谱构建方法研究的基础上,充分考虑中文语境以及医学领域知识覆盖面广的特殊性,先进行医学细分领域模型构建,再通过细分领域模型集成的方法形成了OMAHA中文医学知识图谱模型(以下简称“OMAHA Schema”)。

◆ ◆

中文医学知识图谱模型构建难点

涉及细分领域面广,难以面面俱到

因为知识之间是互相联系的,所以在实际应用中很难用一个细分领域的知识解决所有应用问题,比如疾病发病部位的知识会涉及到解剖结构领域内容,疾病致病原因的知识会涉及到微生物领域的内容,精准医疗则会使用到基因领域知识。因此为尽可能满足医疗不同场景下使用需求,模型覆盖面需要尽可能广,这也就意味着知识梳理工作量将会巨大。

跨界人才较少,工作开展极具挑战

医学知识图谱模型的研制,不仅需要大量的医学细分领域专家,还需要熟悉医学知识图谱模型的信息学专家。虽然目前行业已有一些医学知识图谱产生,但绝大多数主要局限于机构内或课题内小范围应用。真正的跨医学和信息学的复合型专家还是凤毛麟角。在实际构建过程中,可能会出现模型理解不够、工具不熟悉、成员间工作难协调等难题。

◆ ◆

OMAHA Schema 构建路径

细分医学领域模型的构建能够较快地针对特定领域实现应用,但局限性较大,难以适应愈加复杂的多学科融合的医疗领域发展趋势。如果直接进行全医学领域范围模型构建,可能导致对细分领域的解析会比专注于该领域的模型颗粒度更粗,对细分领域的特征刻画会存在一定程度的失真。基于以上考量,决定先选取需求较高、应用场景较多的细分领域入手构建细分领域模型,然后将各细分领域模型进行融合,最后不断优化的方式来实现中文医学知识图谱模型构建。

细分领域模型构建

如果定义的模型范围过大,很容易造成项目难以保质保量地完成。因此首先从临床业务需求较高的领域入手进行构建,包括疾病和症状体征、药品、检验检查、手术操作、解剖结构、基因等。在开展先后顺序上采取按照细分领域逐一完成构建的方法,而非同时多个领域开展。单个细分领域模型构建涉及的专家数量相对较少,工作协调更容易,同时也能从中积累协作、构建经验。

领域模型的梳理需要该领域业务专家和信息学专家共同参与。首先基于循证等级较高的资源进行梳理,如行业已有标准(国际标准、国家标准、行业标准、团体标准等)和教科书等,形成模型的基础内容。然后从领域应用出发,梳理目前相关应用场景下知识的需求,完善领域模型。在这个步骤中,需要调研实际接触具体应用的临床工作人员以及相应的企业人员以获得真实反馈。最后再结合国际上相同领域内成熟的模型进行借鉴。需要强调的一点是,借鉴并非简单的翻译后直接使用,而是在充分了解该模型使用场景、语言语境的基础上理解其内容和模型构建思路,以此来验证构建的中文知识图谱模型是否存在缺失或不规范,从而进一步进行优化。

细分领域模型集成

细分领域的医学知识图谱模型建立完成后需要将它们进行集成,最终形成一个体系性的医学知识图谱模型。模型集成并非简单的细分领域模型的相加,而是要实现真正意义上的融合。我们采取了对相同或相似语义类型和语义关系先进行映射,然后进行合并的方法。合并的过程中包括有冗余语义类型和语义关系的删除,相似语义类型和语义关系的组合产生新的语义类型和语义关系,建立新的语义类型和语义关系等工作。

在模型合并的过程中需要模型建立专家一起参与,以确保大家对映射的认知一致性,并共同商议决定最终结果。

模型优化




上一篇:医院医技科室医学工程科使用医用家具有哪呢?
下一篇:要闻快讯