简介:提出一种改进TF-IDF结合余弦定理计算中文语句相似度方法。首先采用IKAnalyzer分词器对中文语句分词处理,提取核心关键词,然后通过计算句子关键词词频和权重形成的TF-IDF向量组,结合余弦定理实现中文句子相似度计算。改进后的TF-IDF计算方法采用《同义词词林》词典实现对关键词及其同义词词频统计,并通过Lucene技术实现关键词权重快速计算。改进后的中文句子相似度算法不仅考虑句子中关键词的物理特征,还对关键词的语义特征进行相似度计算,提高中文句子相似度计算的准确性。
简介:在当今信息化时代,通信信号调制类型的自动识别技术已经逐渐渗透到我们的生活当中。这项技术需要对待测信号进行系统的分析,提取待测信号的不同特征参数。分析各个信号特征参数的差异,幷讨论和设置判决门限,然后使用决策论方法对待测信号进行判决,最后通过计算机使用仿真软件进行模拟仿真,验证该方法的可行性和影响判决准确率的条件。
改进TF-IDF结合余弦定理计算中文语句相似度
通信信号调制类型的自动识别