简介:21世纪是信息时代,人文学术研究要实现数字化,汉语信息处理有许多问题需要重新加以研究,汉语史研究的数字化是重要的基础工作,计算机辅助汉语史研究的进展将为数字化的学术研究积累宝贵的经验。
简介:三、数据库编辑数据库和书写文本(如印刷型词典)的一个重要差别,在于后者的信息排列顺序是固定的,而前者却是可变的。同一数据库可生成多个排列顺序不同的文本格式。如果不用数据库处理,很难或者说不太可能把一般文本的结构排列作任意变动。文献中把数据库定义为以某种特殊的方式收集和储存数据,以供日后多种目的的使用。在很大程度上讲,这些使用目的在建立数据库时是很难预料的。一般情况下,人们很难明确区分数据库、数据库管理系统和建立基本数据材料的原则。有时人们也把数据库结构分为三种:层次结构,网络结构,相关结构。目前所称的数据库大多为关系数据库(nBRelationDataBase),它包容了层次结构和网络结构的特点。下面就专门介绍一下关系数据库结构的特点。关系数据库以单张表格或多张表格的形式储存数据记录,表格由若干纵列和横行组成。每列为一个字段,记载一定类型的信息;每行为一条记录,包括或涉及几个字段。根据数据库理论,记录之间或字段之间的关系决定了表格的结构性质。关系数据库的得名正来自“关系”二字。两张表格的联系被称为关联。121数据库的记录内容可以和词典内容完全相同,也可只记录一些语言事实或语境等信息。信息在表格中...
简介:<正>李如龙、陈章太的《论闽方言内部的主要差异》(以下简称"差异》)一文,用福建省境内十八个闽方言代表点的四百条语言材料,论证了闽方言内部的主要差异,从而说明福建境内的闽方言可以分为闽东、蒲仙、闽南、闽北、闽中五个次方言区。本文尝试使用计算机聚类分析程序,对上文列举的语言材料作出数量分析,进一步考察和探讨这些方言代表点之间的差异程度以及它们的分区问题。一《差异》中列举的语言材料包括两个方面:语音方面和词汇语法方面。本文直接对这两方面材料进行数量统计,从而对福建境内闽方言内部的主要的语音差异现象和词汇语法差异现象分别作出考察。