引言超句单位的设置是篇章研究的重要课题。以往,学者们探讨这一问题多是为了完善篇章理论。如日语篇章学者主张将篇章研究归纳到语法学的范畴之中,形成语法学视阈下的篇章学。这一构想的基础在于是否认可大于句子小于篇章的超句语法单位。因此,关于超句单位的设想和争论一直从上世纪50年代持续至今。可见,篇章超句单位理论的构建是日语篇章研究中非常重要的一环。随着信息技术和语料库语言学的飞速发展,这一原本针对篇章理论的探讨又被赋予了应用价值。即被应用到人工智能开发和机器翻译研发等领域,为自然语言处理的进一步发展提供语言学支撑。娄开阳(2009)对1067篇汉语新闻报道的篇章结构要素和组合模型进行了穷尽式分析,得出了176种新闻报道的结构模型。其成果证明,篇章虽不像句法一样拥有严谨的规则,却是具有有限模式的,这将对人工智能的文本生成研究起到巨大的推动作用。机器翻译方面,目前篇章级别的文本翻译会“将篇章分割成若干句子,分别完成句子级别的翻译后再合并成目标语言的篇章段落形态。”因此,“在翻译篇章中的句子时加入篇章级别的特征信息可以提高翻译质量”[1]。篇章的分割需要超句单位作为切分线索,篇章级别的特征信息也需要客观的篇章单位标识。综上可知,无论是篇章理论的深化还是自然语言处理技术的进一步发展,都需要从篇章的基本单位入手,构建客观的、具有判定标识的超句单位理论。目前,国内外经常讨论的日语超句单位有「段落」「連文」「文段」“句群”等。本文采用“句群”这一用语表达介于句子和篇章之间的语言单位,通过梳理以往研究,探讨日语句群的成立原理、定义和判定标识,构建日语句群理论。并使用议论文举例说明超句单位的判定方法,验证其有效性。日语句群理论建构——以日语议论文为例的定义、成立原理和判定标识西安电子科技大学外国语学院王金博[摘要]句群判定的语言标识及识别方式对篇章研究具有很强的示范作用。本文的目的是建构用于日语篇章分析的句群理论体系。首先,梳理了国内外日语篇章超句理论的主要成果,基于篇章动态重层结构观明确了日语句群的成立原理和定义。其次,借鉴汉语句群研究关于句群判定形态标识的研究成果,总结出10大类33种日语句群判定的形态、语义标识。并通过议论篇章的案例分析验证了句群理论的有效性及其对篇章模式研究的意义。本研究为日语篇章研究提供更加客观的超句单位理论,使语法学视阈下的篇章研究和篇章结构的量化研究成为可能。也为语料库语言学和...