面向信息处理的汉语最长名词短语界定研究

作者:钱小飞; 侯敏

摘要:目前广泛采纳的最长名词短语定义是以其句法功能划分出的短语子集,导致了近30%的边界识别错误,同时由于对基本特征缺乏一致认识,不同研究的定义结果也有所不同。本文讨论了最长名词短语的长度约束、名词性认定、外延范围和层次构造等问题,提出按照句法位置特征划分出最长名词短语全集,定义为句子中不被其他名词短语直接包含的名词短语,其中包括单词结构、名词性短语和离心式名词短语。新定义的最长名词短语具有功能上的一致性和分布的相似性,减少了边界歧义,它呈现多层分布,但集中的层级分布倾向也预示了高效识别的可能性。

分类:
  • 期刊
  • >
  • 人文社会科学
  • >
  • 哲学与人文科学
  • >
  • 中国语言文字
收录:
  • 万方收录(中)
  • 知网收录(中)
  • 北大期刊(中国人文社会科学期刊)
  • 维普收录(中)
  • 国家图书馆馆藏
  • 上海图书馆馆藏
  • CSSCI 南大期刊(含扩展版)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 中文信息处理
  • 最长名词短语
  • 界定
  • 句法位置
  • 全集

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:语言文字应用

期刊级别:CSSCI南大期刊

期刊人气:1932

杂志介绍:
主管单位:中华人民共和国教育部
主办单位:教育部语言文字应用研究所
出版地方:北京
快捷分类:文化
国际刊号:1003-5397
国内刊号:11-2888/H
邮发代号:82-576
创刊时间:1992
发行周期:季刊
期刊开本:B5
下单时间:1-3个月
复合影响因子:1.49
综合影响因子:1.47