简介:Inthispaper,anewapproachispresentedtofindthereferencesetforthenearestneighborclassifier.Theoptimalreferenceset,whichhasminimumsamplesizeandsatisfiesacertainerrorratethreshold,isobtainedthroughaTabusearchalgorithm.Whentheerrorratethresholdissettozero,thealgorithmobtainsanearminimalconsistentsubsetofagiventrainingset.Whilethethresholdissettoasmallappropriatevalue,theobtainedreferencesetmaycompensatethebiasofthenearestneighborestimate.AnaspirationcriterionforTabusearchisintroduced,whichaimstopreventthesearchprocessfromtheinefficientwanderingbetweenthefeasibleandinfeasibleregionsinthesearchspaceandspeeduptheconvergence.Experimentalresultsbasedonanumberoftypicaldatasetsarepresentedandanalyzedtoillustratethebenefitsoftheproposedmethod.Comparedtoconventionalmethods,suchasCNNandDasarathy'salgorithm,thesizeofthereducedreferencesetsismuchsmaller,andthenearestneighborclassificationperformanceisbetter,especiallywhentheerrorratethresholdsaresettoappropriatenonzerovalues.TheexperimentalresultsalsoillustratethattheMCS(minimalconsistentset)ofDasarathy'salgorithmisnotminimal,anditscandidateconsistentsetisnotalwaysensuredtoreducemonotonically.Acounterexampleisalsogiventoconfirmthisclaim.
简介:包分类被学习十年了;它基于一个给定的规则集合分类包进特定的流动。当定义软件的网络被建议,包分类的一个最近的趋势是放大五元组的模型到多元组。一般来说,多重地上的包分类是一个复杂问题。尽管大多数存在softwarebased算法在实践被证明非凡,他们对经典五元组的模型仅仅合适并且对困难被扩大规模。同时,硬件特定的答案不可弯曲、昂贵,并且他们中的一些是消费的力量。在这份报纸,我们为多核心系统建议一条通用的多维的包分类途径。在我们的途径,新奇数据结构和四个基于分解的算法被设计优化分类并且规则更新。为多地规则,一个规则集合根据领域的数字被切成几部分。每部分独立地工作。这样,这些地在平行被寻找,所有部分结果最后一起被合并。表明我们的途径的可行性,我们实现一个原型并且评估它的产量和潜伏。试验性的结果证明我们的途径比另外的分解底的算法和43%更低的潜伏的完成40%更高的产量平均比另外的算法的统治增长更改。而且,我们的途径平均节省39%记忆消费并且有好可伸缩性。