简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
简介:本文以心理距离为参照点,以汉语日常会话为语料,在语用视点和语用移情及离情理论框架下,探究人称指示语的更换在交际中所起的调距作用和取得的语用效果。通过分析发现,第一人称指示语换指第二或第三人称指示语时,前者拉近了说话人和听话人间的心理距离,增强了话语的亲和力,后者拉近了说话人与第三方间心理距离,便于听话人感受说话人对第三方的情感和立场;第二人称指示语换指第一或第三人称指示语时,前者将听话人移位于说话人位置,两者间心理距离消失,激起情感共鸣,后者将心理距离由远拉近,强化说话人负面情绪,多为严厉批评;第三人称指示语换指第一或二人称指示语时,两者都将心理距离拉远,不同之处在于前者弱化自我意识以增强客观性,后者通过模糊听话人身份来提高礼貌程度。