基于自然语言处理技术的电网招标资料查重系统研制

(整期优先)网络出版时间:2018-05-15
/ 1
电网公司在项目招标采购过程中,一般要对招标资料进行查重工作,在历史项目资料库中查找是否存在类似项目,以防止项目重复招标的情况发生,避免资金浪费。文章使用潜在语义索引的方法,对文档中的语义进行分析,使用自然语言处理领域的中文分词、词向量转换、词权重计算、主题建模等技术构建了一套文档相似度分析系统,可在海量历史项目资料库中快速找出与目标文档相似的项目,并计算出文档相似度百分比,辅助招标采购专职判断招标资料是否合规。系统的研究与应用,对规范电网公司项目招标采购管理具有重要实用价值。