简介:随着“互联网+”概念的普及,网络上的资源随之成倍增长.面对庞大的数据资源,传统的搜索引擎Baidu、Google等已经不能满足人们对于特定信息的获取需求.作为搜索引擎抓取数据的重要组成部分,网络爬虫的作用非常重要.本文主要介绍了网络爬虫的概念、组成模块以及工作流程,在通用爬虫的基础上提出一种聚焦型网络爬虫系统,以python和相应的第三方库为主要工具,通过定义采集函数和给定豆瓣网最新上映电影的网址,快速搜索该网址某电影的影评信息,对页面内链接和外链接进行有效爬取.然后,再对获取到的数据进行分词处理,根据关键词的出现频率生成词云.实验结果表明,该聚焦型爬虫系统能够将所有影评信息以JSON格式存储到本地,并通过词云直观的展示出来.
简介:软件定义网络(SDN)将数据层与控制层相分离,是一种新型网络体系架构.针对目前SDN网络还不能提供路由服务问题,设计了一种基于OpenFlow技术,使得SDN网络拥有路由转发功能的方案.依托RouteFlow平台,以内核虚拟化技术为基础,以Quagga软件为路由引擎,通过OpenFlow控制器为数据平面提供路由逻辑控制策略.实验结果表明,该方案不仅让SDN网络具有了路由转发功能,还能使系统保持较好的稳定性.