一:信息检索中,主题词与关键词的区别
主题词与关键词最大的区别就是主题词经过了规范化处理。
主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:白介素2、白细胞介素2、IL2、IL-2等表达同一概念的不同书写形式规范为“白细胞介素2”。
主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。
而关键词是属于自然语言的范畴,未经规范化处理,也不受主题词表的控制。如:对于“白细胞介素2”这一概念可有白介素2、白细胞介素2、IL2、IL-2等不同形式来表达。
因此,为了达到较高的查准率和查全率,如果检索工具提供了主题词这一检索途径的话就应该选择主题词来进行检索,而不应该选择关键词。
例如:利用MEDLINE光盘数据库检索有关“肝肿瘤”方面的文献。
MEDLINE光盘数据库既提供了主题词途径,也提供了自由词(关键词)途径。如果选择关键词途径来进行检索,欲达到较高的查准率和查全率,就得查找“liver cancer”、“liver carcinoma”、“liver neoplasm”、“liver tumor”、“hepatic cancer”、“hepatic carcinoma”、“hepatic neoplasm”、“hepatic tumor”等词,另外还得考虑像cancer、carcinoma、neoplasm、tumor等词还有复数形式;而如果选择主题词途径进行检索就只需查找“liver neoplasms”一词就行了,这一词就包括了以上所提及的不同的表达形式。由此可见,选用主题词途径检索,既能满足较高的查准率、查全率,又能提高检索速度。
二:分类检索语言与主题检索语言各有哪些优缺点
1)检索语言是指用于描述信息系统中信息的内容特征及外部特征和表达用户信息提问的一种专门语言,目的是为了便于检索文献。
2)类型:按检索语言是否受控可分为人工语言和自然语言,按检索时的组配实施状况可分为先组式和后组式检索语言,按描述信息特征的不同可分为描述信息外部特征的检索语言和描述文献内容特征的检索语言。
三:在主题检索语言中,主题词包括?
a、标题词 b、单元词 c、叙词 d关键词;
主礌检索语言可分为标题词语言(标题法)、单元词语言(元词法)和叙词语言(叙词法)。关键词语言(键词法)因其性能与上述几种语言相似,通常也归入主题检索语言一类
四:检索语言的检索语言的结构
:一,描述文献的外表特征(书刊篇名——题目索引,著作姓名——著作索引,文献序号--序号索引,引用文献--引文索引)二、描述文献内容特征1、体系分类语言——分类索引2、主题语言(标题词——标题词索引。单元词——单元词索引,关键词——关键词索引,叙词——叙词索引)3、代码语言(分子式等——分子式索引等各种专用索引,结构式——结构式索引)检索语言种类:一、自然语言(关键词、题名即标题、全文、引文、作者和摘要等)二、人工语言(分类检索语言、主题检索语言、代码检索语言)
五:什么是信息检索语言
(一)概念 为了使检索的过程,即文献标识和信息提问的对比进行得顺利,二者都需要用一定的语言来加以表达。只有借助于这种语言,文献的标引人员与检索人员才能有一个共同的约定,彼此才能沟通思想。也就是说,文献存储时,文献的内外特征按照一定的语言来加以描述,而检索时信息提问也按照一定的语言来加以表达。这种把文献的存储与检索联系起来、把标引人员与检索人员联系起来以便取得共同理解、实现交流的语言,就叫做检索语言。 检索语言是: ◆自然语言中或专业文献中精选出来并予以规范化的一套词汇,如《汉语主题词表》、《医学主题词表》。 ◆代表某种分类体系的一套分类号码,如《中国图书馆图书分类法》。 ◆代表某一类事物的某一方面特征的一套代码(如水分子式H2O)。 (二)检索语言的类型 1、体系分类语言(规范化语言) 如《中国图书馆图书分类法》、《杜威十进制分类法》等。 2、主题词检索语言 1) 标题词(subject headings,规范化主题语言)也称主题词, 如美国《医学主题词表》、我国《中医药学主题词表》等。 2)关键词 非规范主题语言,禁用词 (Stop Word) 以外的具有实际意义的词。 例:检索在严重烧伤糖尿病患者治疗中应用胰岛素泵文献 选择关键词:烧伤,糖尿病,胰岛素泵 3)题名 文献信息资源的名称,篇名、刊名、书名、网址等。 4)全文 资源全部内容中的字符或字符串 5)引文 参考文献的作者、篇名、来源文献中抽取出来的词 6)作者 副 主 题 词 对一个医学主题词(叙词)的多个方面进行修饰限定的词,又称限定词。如“色素瘤”这一主题词涉及到色素瘤的病因、病理、诊断、治疗、放射照相术、外科学、微生物学、死亡等多个方面,每一个方面就是一个副主题。 西医副主题词83个,中医中药副主题词有 9个。使用副主题词的目的就是为了增强主题词的专指性,缩小检索范围,节省检索时间。 并非每个副主题词都能与任何主题词组配使用,主题词与副主题词之间必须遵循一定的逻辑关系。
六:主题语言最早出现的类型
一. 简洁性。说明文的遣词造句,应简洁平实、通俗易懂。
二. 准确性。说明文以传授知识为目的,这就要求它必须用准确的语言,如实地反映事物的特征、本质、规律。说明文的语言的准确性是说明文语言的先决条件。表示时间、空间、数量、范围、程度、特征、性质、程序等,都要求准确无误。
三、科学性。介绍科学知识的说明文,要特别注重科学术语的准确使用。
四. 严密性。为了使读者对较复杂的事物、较深奥的事理有明晰确切的理解,说明文常常恰当地使用修饰和限制词语,讲究语言的周到严密。
五、条理性。任何事物都具有它本身的条理,我们说明事物就要按照它本身的条理来安排说明顺序,使之眉目清楚,有条不紊。
六. 逻辑性。有的说明文,要从事物的内在联系上进行说明,语言逻辑性强。
七. 趣味性。叶圣陶先生说:“说明文不一定就是板起面孔来说话,说明文未尝不可带一点风趣。”为了把事物的特点说得更加生动形象,增强文章的启发性和感染力,说明文要适当地采用生动的说明。
七:检索语言的概念是什么?
SQL
八:文献检索中,主题语言是一类检索语言,以下哪一个不是检索
主题词是文章标题的简略,以及文章的主旨,文中不一定出现,可能是作者对文章大意的概括和总结性语言。
关键词是文章中关键的词语,文章中一般都会出现。