中文 SNOMED 电子3.4 功能设计、实现与应用
李包罗1 李恩生2 魏永华1
国际系统医学术语全集( The Systematized Nomenclature of Human and Veterinary Medicine, SNOMED)是当前国际上广为使用的一种医学术语标准。它对于医学信息的标准化和 电子化起着十分重要的作用。其工作经过我国数十位专家、学者十余年的辛苦努力,已经完成。本文作者是中文版SNOMED的主编和电子版的主要设计者。文章简要介绍了SNOMED的背景资料;具体描述了中文SNOMED电子版的内容、功能设计与实现;最后,扼要讨论了SNOMED在中国可能的应用领域与前景。
关键词 SNOMED 医学术语 标准化 电子词典
Abstract The Systematized Nomenclature of Human and Veterinary Medicine (SNOMED) is a large-coverage, fine-grained specialized medical lexicons which has been widely used in the current world. The SNOMED has been playing a more and more important role of medical information standardization and computerization. The translation work from English to Chines
e has been finished by more than 70 Chinese scholars and specialists during last 10 years. The authors of this paper are the chief editor and designer of the Chinese SNOMED EV 3.4. This article introduces the background briefly, describes the contents, function design and implement in detail and finally discusses the application fields and future of SNOMED in china.
Keywords SNOMED; Medical Terminology; Chinese; Standardization; Electronic lexicon
1. 简介
1.1 SNOMED 的发展历史i
SNOMED 的前身叫SNOP (Systemized Nomenclature of Pathology), 1965年发表。该项作的倡导者与领 导者是著名病理学家 Roger A. Côté博士。其目的就 是为病理学家用于医学信息 的存储、提取与交换。 当时SNOP有四个轴1axis)。
1974SNOP更名为SNOMED, 因为它的扩展使其应 用范围超出了病理学的局限。
1977SNOMED的第一个电子版(Electronic Version of SNOMED)问世。
SNOMED 第二版发行于1979年,它包括了44587 词条,六大模块。
第三版 (SNOMED III, SNOMED International) 发行 1993年, 包括了130,580词条和十 一大模块。该 版的编辑出版正式得到美国病理家学会(CPA, College of American Pathologist) 的授权与支持。 美国国立医学图书馆在它的统一医学语言系统 (UMLS, Unified Medical Language System) 中包含SNOMED
(axis)是指SNOMED中所涉及的医学术语的基本分类。
1997年发行的3.4版是中文译本的原版。它包括了大约150,000词条,并且建立起32,027 词条与 ICD-9-CM的对照关系。
最近的SNOMED版本是19988月发行的3.5版,包括156965词条和压缩过的12个模块,比3.4版新增 6,446词条。
1.2 中文SNOMED电子版 的内容
中文SNOMED电子版是中文SNOMED.4版的电子化产品,其主要内容是完全一致的,只
是发行介质不同。当然电子版提供了比书更为灵活、方便的查询功能,同时也为SNOMED进一步的计算机化应用准备了条件。
SNOMED试图包括医学(目前尚不包含中医)中使用的全部术语,是当前国际上使用最为广泛的大规模标准化医用术语数据库。它与普通的词典不同,SNOMED所含词条不是独立的、彼此无关的,而是根据一些原则严格组织起来的。为了便于计算机的应用,SNOMED还为每个词条赋予唯一的编码。
中文SNOMED电子版含145,856词条,其与英文版的数目(146,217)不同是由于中文删去了英文的异型拼写词条(例如 anaemia anemia )SNOMED 电子版共分为十一个模块:
解剖学(T, Topography)用于人、兽医学的解剖学 术语;
形态学(M, Morphology)用来描述人体结构变化 的术语, WHO《国际疾病分类》中所 用编码、 语与之完全一致;
功能 F, Function 描述身体生理和病理的功能, 包括护理人员使用的对病人观察和 诊断的术语; 活有机体 L, Living Organisms 完整的动、植物 学分类,基本包含了所有病原
体和动物疾病的传病媒介;
化学制品、药品和生物制品 C, Chemicals, Drugs, and Biological Products);
物理因素、活动和力(A, Physical Agents, Activities and Forces 通常与疾病和创伤有 关的器具和活动 的项目表;
职业 J, Occupations 国际劳工局(ILO)的职业 目录;
社会环境 S, Social Context);
疾病/诊断 D, Diseases/Diagnoses);
操作 P, Procedures)手术与操作相关术语;
连接词/修饰词 G, General Linkage/Modifiers2 用来连接和修饰每个模块中术语的连 接词、描述符 及限定词;ii
除了将词条划分为模块外,SNOMED还具有层次结构。层次结构通过该词条代码的树型构造表达。例如: T- 解剖学 第一层是解剖学模块 T-60000 消化器官 第二层是消化系统
T-61000 唾液腺 第三层是唾液腺子系统 T-61100 腮腺 第四层指腮腺 T-61130 腮腺管 第五层特指腮腺管 每一个词条的内容包括:编码、中文名、英文名、类别符、层次、与该词条相关的外部编码,ICD-9-CM码、药品编码、药厂编码、酶编码及SNOMED相关词条的交叉参照表。
SNOMED的正文外,中文SNOMED电子版还提供了一些辅助字典供用户查阅,包括 关键词表、精选词表、西方常见姓氏表、肿瘤形态学编码和酶编码。
2. 中文SNOMED电子3.4版功能设计
中文SNOMED电子3.4版设计在PCMS汉字Win95/Win98的环境下运行。其主要功能是电子字典,即帮助用户方便、快速、完整、准确地英汉双向查询所需词条与编码。
2.1 界面设计集成化
系统采用了集成化的界面设计风格,即将多种类型的构件集中安放在一个窗口内,其中包括下拉表、数据窗、功能键、多选键、互斥键、多选卡片式窗
括号中的第一个大写字母是该模块术语编码的首字母
口等,这与微软应用软件的设计风格相一致,人们
正在越来越习惯这种操作方式。所有要求,无须转换窗口即可完成。下图是该系统的主界面:
图的右上方是查询策略选择区,图的右下方是结果
词条摘要显示区,左上方是查询条件录入区,左中间是启动键,左下方是词条细节显示区。
2.2 灵活多变的查询策略iii
本系统的主要特点是它灵活多变的查询策略的设计与实现。一个拥有十五万词条的最为完整的医学术语词典,可能有各种应用。为了适应不同的使用目的、不同的计算机使用经验、不同的查准率与查全率要求、不同的响应时间需求,最重要的是为用户提供操作方便的多种查询方法。 2.2.1 查询范围
用户可以限定其查询结果仅仅来自某一模块,
例如T解剖、M形态、F功能等可任选其一。缺省值是全部 SNOMED词条。
系统提供包括SNOMED第一、第二层编码的
总目录,使用户可以象阅读书本一样翻阅电子词典。该功能是特为没有任何电子字典使用经验的人设计的。
用户可以事先限定返回查询目标词条的最大数
量,区分为100100010000三个档次。缺省值是100。这样设计可以避免由于用户给的查询条件过宽,系统返回结果词条太多,导致系统反应太慢,而这又不是用户本意的情况出现。
凡编码类查询,系统均容许用户给定一个范
围。这显然有助提高查全率。 2.2.2 查询方法
用户可用下拉表的方法挑选不同的查询途径,包括SNOMED码、ICD码、酶编码、药品码、
拼音/五笔码、汉字和英文。
用户选用拼音方法查询是实际指按汉字串每一
个汉字汉语拼音的首字母查。例如:肺动脉瓣的汉语拼音是:Fei Dong Mai Ban, 在查询时只需输入 FDMB
用户选用五笔方法查询实际上是指按汉字串每 系统在查询窗口的右下方显示查询结果的摘要信 一个汉字五笔字型码的首字母查。例如:肺 息,包括词条的编码、中文名和英文名。
editor版本
动脉瓣的五笔字型是:Egmh Feln Eyni Udrf, 在查询时只需输入 EFEU用户选择匹配是指给定条件与目标术语的比对是从左到右逐一比较,如果给定条件从左边第一个到最右边的字母/汉字与目标术语相应位置的字母/汉字均一致,则条件满足,该术语被选中。否则称不匹配,该术语不会被选中。用户可选精确,精确指精确匹配。精确比匹配严格。它不仅要求匹配,而且要求给定条件与目标术语长度一致。例如肺动脉(给定条件)与肺动脉瓣(目标术语)匹配,但不是精确匹配。肺动脉(给定条件)仅与肺动脉(目标术语)精确匹配。用户可选蕴涵,蕴涵是指目标术语中只要包含给定条件即被选中。它没有匹配严格。例如当采用蕴涵查询时,给定条件是肺动脉瓣,则风湿性肺动脉瓣狭窄会被选中。如果采用匹配或精确查询,风湿性肺动脉瓣狭窄均不会被选中。蕴涵的查全率最高,但速度最慢。用户可选择联机查询方式,联机查询是指系统接受用户键盘输入条件时,动态、实时地为用户查符合已录入条件的术语。开始动态、实时查的时间取决于用户定义的字符串长度,