简介:以氨基酸组成为特征对膜蛋白的分类,忽略了序列残基之间的相关性信息,而采用传统支持向量机算法作为分类算法,在解决多类问题时会出现分类盲区问题。针对这两种情况,计算蛋白质序列的氨基酸组成、二肽组成以及6种氨基酸相关系数,将三类特征结合,作为膜蛋白序列的特征向量;同时采用模糊支持向量机作为分类器,解决了传统支持向量机在多类数据识别中的盲区问题。测试结果表明,在相同特征输入下,模糊支持向量机分类性能优于传统支持向量机;在相同分类器的情况下,氨基酸组成、二肽组成和相关系数组合的特征选择方法的分类性能优于只使用其中一类或两类特征的方法;而采取组合特征和模糊支持向量机相结合的分类策略,在独立性数据集测试中的整体预测精度达到97%,优于现有的多种分类策略,是目前最有效的膜蛋白分类方法之一。
简介:胸痛三联征在临床上有相似的胸痛症状,误诊率居高,其确切病因尚不十分明确。针对经典支持向量机不适用于胸痛三联征此类非平衡数据集分类的缺点,本研究结合径向基核函数、布谷鸟算法以及支持向量机,提出一种基于布谷鸟算法优化支持向量机的分类识别模型,用于胸痛三联征的分类诊断。在收集到的735例有效样本数据集上,采用Java程序抽取平衡数据集。实验结果显示,基于平衡数据集,该模型的平均正确率为80.667%;基于非平衡数据集,其平均正确率为97.767%,相比经典支持向量机、粒子群算法-支持向量机、遗传算法-支持向量机均有不同程度的提高。因此,本研究模型对胸痛三联征的分类诊断具有一定的参考价值。