简介:目前网络消费变得越来越频繁,但钓鱼网站给网上交易平台及相关用户带来较重的经济损失,如何有效甄别钓鱼网站,减少用户损失,显得尤为重要。文章通过URL特征、网页内容、网页图片特征等属性来描述网页,根据钓鱼网页不同类型,针对各个特征属性,构建不同的分类器,然后通过逐步判别方式,达到动态预测各待检测网页的目的。工具上,针对处理大数据集,利用SPARK平台计算结果,通过实验测试,取得了良好的分类效果。
基于SPARK平台的钓鱼网站识别技术研究