简介:21世纪是信息时代,人文学术研究要实现数字化,汉语信息处理有许多问题需要重新加以研究,汉语史研究的数字化是重要的基础工作,计算机辅助汉语史研究的进展将为数字化的学术研究积累宝贵的经验。
简介:三、数据库编辑数据库和书写文本(如印刷型词典)的一个重要差别,在于后者的信息排列顺序是固定的,而前者却是可变的。同一数据库可生成多个排列顺序不同的文本格式。如果不用数据库处理,很难或者说不太可能把一般文本的结构排列作任意变动。文献中把数据库定义为以某种特殊的方式收集和储存数据,以供日后多种目的的使用。在很大程度上讲,这些使用目的在建立数据库时是很难预料的。一般情况下,人们很难明确区分数据库、数据库管理系统和建立基本数据材料的原则。有时人们也把数据库结构分为三种:层次结构,网络结构,相关结构。目前所称的数据库大多为关系数据库(nBRelationDataBase),它包容了层次结构和网络结构的特点。下面就专门介绍一下关系数据库结构的特点。关系数据库以单张表格或多张表格的形式储存数据记录,表格由若干纵列和横行组成。每列为一个字段,记载一定类型的信息;每行为一条记录,包括或涉及几个字段。根据数据库理论,记录之间或字段之间的关系决定了表格的结构性质。关系数据库的得名正来自“关系”二字。两张表格的联系被称为关联。121数据库的记录内容可以和词典内容完全相同,也可只记录一些语言事实或语境等信息。信息在表格中...
简介:<正>李如龙、陈章太的《论闽方言内部的主要差异》(以下简称"差异》)一文,用福建省境内十八个闽方言代表点的四百条语言材料,论证了闽方言内部的主要差异,从而说明福建境内的闽方言可以分为闽东、蒲仙、闽南、闽北、闽中五个次方言区。本文尝试使用计算机聚类分析程序,对上文列举的语言材料作出数量分析,进一步考察和探讨这些方言代表点之间的差异程度以及它们的分区问题。一《差异》中列举的语言材料包括两个方面:语音方面和词汇语法方面。本文直接对这两方面材料进行数量统计,从而对福建境内闽方言内部的主要的语音差异现象和词汇语法差异现象分别作出考察。
简介:我国在七十年代末、八十年代初开始引进微型电子计算机,电子计算机在人们社会生活中的应用问题逐步提上日程,迄今为止虽说时间短促,然而进展还是可观的。从报刊和杂志上,我们经常可以看到某科研单位推出某种中文系统,某研究人员研制的某中文系统通过签定。在各种各样的电子计算机应用开发展览、展销会上,应用于人们社会生产、生活中的中文系统也比较多。例如电子计算机中文编辑系统,用电子计算机控制的中文制版系统,电子计算机中医诊断处方系统,“红娘”系统,换房系统,银行、储蓄所业务联网系统,办公室自动化系统,人事档案系统,生产自动化管理系统,文献资料自动化管理系统,情报检索系统等等。