简介:由于工具书编纂队伍庞大,工作流程上又多头并进,所以工具书编纂过程中难免会出现内容交叉重复问题。为了减少工具书查重的工作量,文章提出了一种基于文本聚类的查重方法。试验表明,分层聚类算法可用于大型工具书词条查重工作,它对工具书编纂中解决词条交叉重复问题是有效的。
简介:“病”的本义,今或作重病义,或作疾病义。通过对《诗经》等八部早期上古文献中的“病”、“疾病”用例考察,发现早期疾病义都用“疾”,“病”不用作疾病义,更无重病义;“疾病”连用,其“病”为形容词的危重义。进而通过对八部上古文献中“病”、“疾病”所有词义及其训诂的梳理,可定“病”的本义是困苦义。
简介:“病喻”这个词,词典上查不到。它是我生造的。何谓病喻?就是有“病”的比喻,或者说.不通的比喻。辞格里面使用频率最高的,比喻大概要数第一,能登冠军宝座。难怪钱钟书先生说:“比喻是文学语言的根本。”
基于文本聚类的工具书查重方法研究
“病”本义考证
“病喻”偶拾