文本检索和数据统计中的语言学知识有哪些?

题目
问答题
文本检索和数据统计中的语言学知识有哪些?
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

简述文本的自动校对和摘要中的语言学知识。


正确答案:文稿校对对有些语言来说比较简单,如英语的拼写检查,只要计算机中储存一部词典和词形变化词表即可,语法错误也可以通过限定的动词和其他的词语的关系来判断.对于一些语言――如汉语来说,文稿校对就比较困难,看字形无法判断文字的正误,而词语是否写错须先切分词再联系上下文才能看出来,这就需要向计算机提供词语切分和搭配的更多信息.文稿摘要一方面是利用语料库信息,如选择时间,地点.动作等要素词语,文本中复现频率最高的关键词语和各自然的首句等.同时也要利用必要的语言学知识,如把重要的语句用一定的关联词语加以连接等.

第2题:

简述面向人的语言学知识和面向计算机的语言学知识。


正确答案:语言信息处理:人类的语言叫自然语言,用于计算机来或者说是达成人和计算机之间的语言沟通叫做语言信息处理.
语料库语言学:利用计算机强大的运算能力,让计算机来处理从成千上万的语言材料中去统计和发现某些有用的知识.换句话说就是把经过概率统计得出的知识作为计算机需要的知识,而不依赖于人所制定的原则和圾.规则的语言学知识,采用这种倾向的也就是所谓基于经验的信息处理研究,与此相关的语言学研究叫做语料库语言学或工程语言学.
理论语言学:指沿着原有的语言学研究方向继续努力,把提供给计算机的语言学知识搞得更细致.更严格,更严密,比如建立词义的搭配关联系统,建立形式化的语法构造模型,建立语句结构的论旨关系柜架,建立话语的语气标志等.也就是说,仍然把语言学的原则和规则作为计算机的需要的知识,采用这种研究倾向的就是所谓的基于规则的信息处理研究,与此相关的语言学就是理论语言学或科学语言学.

第3题:

从事社会语言学研究,既要具有语言学的基础知识,又要对相关学科知识有必要的了解和掌握。()

此题为判断题(对,错)。


参考答案:正确

第4题:

简述语音实验与语音的识别合成中的语言学知识。


正确答案:语音识别是让计算机模拟人的语音识别是让计算机模拟人的听觉器官的反应来接收语言信号并作出回应动作或给以语言回答.语音合成就是让计算机模拟人的发单器官的动作并发出类似的声音.目前像汉字输入已经采用语音识别技术

第5题:

汉字编码和汉字处理中的语言学知识有哪些?


正确答案:(1)要给每个汉字确定一个代码(内码),计算机通过代码就能识别和输出汉字
(2)要给每个汉字的代码确定相关的输入信号(外码),如键盘上的拼音输入.笔画输入等,用键盘字母信号与内码关联.

第6题:

语料库和语料分析中的语言学知识有哪些?


正确答案:语料库一般分两种:一是未标注任何附加信息的原始文本,称“生语料库”,也就是一般用于检索和统计的语料,另一种是标注了一定附加信息的加工文本,称“熟语料库”.比如汉语词和词之间连写的,要给出词的切分信息,汉语的词类常常是灵活的,熟语料库要给出不同的词类信息。此外像词语的搭配.词语的语义属性等,也可以加以细致的标注.熟语料库不但需要的语言信息更多,即实际上标注的都是语言学信息,而且反过来对语言学的研究的用处也更大,即可以有目的的对经过标注的语料进行分类和分析,从而获得更多的语言现象参数和语言学知识.语料库在词典编纂和计算机辅助教学等方面也有重要作用.

第7题:

语言学在历史学和考古学中的应用有哪些?


正确答案:中国甲骨文和金文的辨认全靠汉代语言学家许慎给我们留下了一部《说文解字》,而甲骨文和金文的解读则大大促进了中国古代史的研究古埃及的文字没人能认读,后来语言学家解读了在一块石碑上刻下的这种文字和古希腊文对照的铭文,才解开了古埃及文字之谜,美洲玛雅文字的解读则揭开了欧洲人来美洲以前印第安人历史的神秘面纱。

第8题:

社会语言学与文化语言学有哪些异同?


正确答案:1、共同性:社会语言学研究语言与社会的相互关系,文化语言学研究语言与文化的相互关系。可是社会和文化密不可分,社会现象与文化现象是完全重合的,所有的社会现象都是文化现象,所有的文化现象也都是社会现象。社会现象与文化现象的关系就像是等边三角形和等角三角形的关系一样。所以与其说社会语言学与文化语言学的研究对象有什么不同,不如说二者的研究角度和侧重点有所不同。
2、差异性:文化语言学的内容更为广泛,几乎可以包容语言学的全部内容,而文化语言学难以包容文化语言学的全部内容。⑴首先,社会语言学主要是研究发达的复杂社会的语言状况的,而不大涉及文明前的简单社会的语言状况。⑵第二,社会语言学一般是以一个社会内部的言语共同体的语言状况为研究对象,而不大关心不同社会的语言状况的系统比较。⑶第三,社会语言学主要关心社会语言的现状,只是在说明语言的社会变异的前因后果时,才涉及它们的历史。⑷第四,社会语言学主要关心的是言语交际方式的选择及其社会条件和社会意义,而不大关心语言结构体系本身。⑸第五,社会语言学把言语交际活动看作是一种社会行为,重点研究言语行为规范与其他社会行为规范的关系,对于文化语言学来说,这些内容都属于语言与制度文化和精神文化的关系。

第9题:

从事社会语言学研究,既要具有语言学的基础知识,又要对相关学科知识有必要的了解和掌握。


正确答案:正确

第10题:

语言学的知识可以用于哪些信息处理技术?


正确答案:语言学的知识首先可以用于机器翻译,除此之外还有相当广阔的领域.有的简单,如汉字处理,文本检索和数据统计,信息传输,校对和摘要等.有的困难些,如语音的识别言语生成.语义分析.人机对话.人工智能等.这些处理技术需要的语言学知识自然不是相同的,有的主要依赖语料统计知识,如文本的检索.语句统计,词语频率.搭配.图书查询等.有的则必须部分或全部依靠语言规则知识.如文字编码,语音识别.自动校对.词语分类.言语生成.语义分析.有的工作依靠现有的语言学知识远远不够,如机器翻译还因缺少相应的知识无法做到即席准确生动的翻译.