语料库语言学 - (EPUB全文下载)
文件大小:4.32 mb。
文件格式:epub 格式。
书籍内容:
图书在版编目(CIP)数据
语料库语言学/黄昌宁,李涓子著.—北京:商务印书馆,2002
(语言与计算机丛书)
ISBN 7-100-03364-0
Ⅰ.语… Ⅱ.①黄…②李… Ⅲ.计算机应用—语言学—研究 Ⅳ.H0
中国版本图书馆CIP数据核字(2001)第057971号
所有权利保留。
未经许可,不得以任何方式使用。
语言与计算机丛书
语
料
库
语
言
学
语料库语言学
黄昌宁 李涓子 著
商务印书馆出版
(北京王府井大街36号 邮政编码100710)
商务印书馆发行
北京民族印刷厂印刷
ISBN 7-100-03364-0/H·850
2002年4月第1版
开本787×1092 1/32
2007年7月北京第2次印刷
印张9⅛
定价:15.00元
目录
第1章 绪论
第一节 什么是语料库?什么是语料库语言学?
第二节 语料库语言学的发展历史
第三节 语料库语言学的发展方向及前景
第四节 计算机在语料库语言学中的作用
第五节 语料库语言学的研究内容
第六节 本书的编排
第2章 语料库的设计与开发
第一节 语料库设计和编纂中的问题
第二节 建设一个语料库
第三节 语料库的类型
第四节 国外语料库介绍
第五节 汉语语料库的建设
第3章 语料库的加工和管理技术
第一节 语料的索引及其应用
第二节 语料库语言学中的统计
第三节 逐词索引软件及其应用
第四节 语料库标注
第4章 基于语料库方法的语言学研究
第一节 语言研究中的语料库方法
第二节 现代汉语句型统计与研究
第三节 词典学研究
第四节 汉语名词的语义分类研究
第五节 词汇—语法问题调查
第六节 语域变体(register variation)研究
第5章 语料库方法在计算语言学中的应用
第一节 汉语文本中交集型切分歧义的研究
第二节 汉语基本名词短语识别研究
第三节 基于结构词义空间的汉语词义排歧模型
附录 词性标记集
参考文献
第1章 绪论
“语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响”。这是汤姆斯(Thomas)等人1996年为祝贺语料库语言学的主要奠基人和倡导者里奇(Leech)六十诞辰而编纂的语料库语言学研究论文集的开场白。近年来,对语料库语言学类似的说法频频见于导论和方法论的专著及教科书中,它不仅仅是语料库语言学家的自誉,而且正在成为整个语言学界的共识
[1]
。
第一节 什么是语料库?什么是语料库语言学?
语料库(corpus)顾名思义就是存放语言材料的仓库(或数据库)。传统上,语言学家用语料库这个术语表示可作为语言研究基础的、大量自然出现的语言数据。这些语料库可以由书面语和(或)口语的样本组成,并通常被用来代表一种特定的语言或语言变体。在计算机出现之前,研究者——特别是词典编纂者,也有语料库,只是规模小、范围窄,因而难以在学术界形成气候。近40年以来,语料库这个术语通常指以电子形式保存的语言材料,并被广泛用于语言研究和语言工程。随着计算机功效的成倍增长,语料库在规模、多样性和使用方便等方面都发生了剧烈的变化。与此同时,为了存取和加工语料库所拥有的信息,已经开发了大量专用的软件。计算机语料库迅速成为语言研究的一种普遍资源,现在世界上已经建立了许多规模较大的语料库,有些是国家级的,有些是大学和词典出版商联合研制的。另外,由于个人电脑的迅猛发展,存储数据的硬磁盘造价持续下降,研究者个人也开始建立适合自己研究兴趣的小型语料库。
虽然语料库语言学研究已经历了不短的历史,但还没有一个公认的定义。下面引述两个见诸书本的定义:
定义1:以现实生活中人们运用语言的实例为基础进行的语言研究,称为语料库语言学。(McEnery & Wilson,1996)
[2]
定义2:以语料为语言描写的起点,或以语料为验证有关语言假说的方法,称为语料库语言学。(Crystal,1991)
[3]
从上述两个定义可见,作为一个学科的名称“语料库语言学”与“语法学”或“语义学”不同,它不属于语言自身某个侧面的研究,而是一种以语料库为基础的语言研究方法。它实际上包括两方面的内容:一是对自然语料进行加工、标注,二是用已经标注好的语料进行语言研究和应用开发。
第二节 语料库语言学的发展历史
语料库语言学作为一种语言研究的方法,可以追溯到上个世纪,甚至更为久远。文献
[1]
对语料库语言学进行了论述,在此现在一般以乔姆斯基(N.Chomsky)转换生成语法的兴衰史为参照点,将语料库语言学的发展历史分为如下三个时期
[1]
。
一、早期的语料库语言学
早期语料库语言学是指20世纪50年代中期以前,即以乔姆斯基提出转换生成语法理论之前的所有基于语言材料的语言研究。在50年代,语料库在语言研究中曾被广泛使用,主要集中体现在以下几个方面。
1.语言习得
语言习得是较早普遍用语料为研究方法的一个领域。19世纪70年代,在欧洲兴起了儿童语言习得研究的第一个高潮。当时许多研究素材来自父母对其子女话语发展的观察日记。据悉,这些日记作为原始资料,不仅是当时Preyer
[4]
和Stern
[5]
等人提出理论假说的依据,而且时至今日仍是许多学者的研究材料之一。自本世纪30年代以来,语言学家和心理语言学家提出了许多关于儿童在不同年龄段的语言发展模式,这些模式大都建立在对儿童自然话语的大量观察材料的基础上。
2.方言学
方言学从其产生以来,就与语料结下了不解之缘。在西方,方言学脱胎于19世纪的历史比较语言学,最初的兴趣主要是,运用直接法所获得的有关单音不同分布的事实来绘制方言地图。“方言研究者手持笔记本,后来是手提录音机,记下或录下他所遇到的一切方言材料。此种采样方式至今仍为某些业余研究者所沿用,它对于研究方言词汇的分布有一定价值”(Francis,1980)
[6]
。在我国,运用语料的研究方法可追溯至周秦。据南朝应劭《风俗同义序》“周、秦常以岁八月遣
轩之使,求异 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 语料库语言学 - (EPUB全文下载)