简介:随着“互联网+”概念的普及,网络上的资源随之成倍增长.面对庞大的数据资源,传统的搜索引擎Baidu、Google等已经不能满足人们对于特定信息的获取需求.作为搜索引擎抓取数据的重要组成部分,网络爬虫的作用非常重要.本文主要介绍了网络爬虫的概念、组成模块以及工作流程,在通用爬虫的基础上提出一种聚焦型网络爬虫系统,以python和相应的第三方库为主要工具,通过定义采集函数和给定豆瓣网最新上映电影的网址,快速搜索该网址某电影的影评信息,对页面内链接和外链接进行有效爬取.然后,再对获取到的数据进行分词处理,根据关键词的出现频率生成词云.实验结果表明,该聚焦型爬虫系统能够将所有影评信息以JSON格式存储到本地,并通过词云直观的展示出来.
简介:在视频编码中,DCT系数分布模型是率失真理论模型的基础,视频量化一般可分别为硬判决量化(HDQ)以及软判决量化(SDQ),SDQ算法能实现最优编码性能,但其中维特比算法会导致严重的系数间串行处理依赖.比较而言,基于死区(deadzone)的HDQ算法率失真性能略有损失,但是不考虑系数间的相关性.提出了一种基于分段逼近TCM模型(TransparentCompositeModel)的自适应硬判决量化算法,采用更精确的DCT分布估计模型,估算不同频率分量DCT系数的分布参数.根据模型参数及DCT系数分布参数,优化构造自适应的死区偏移量模型.实验表明,相对于固定偏移量HDQ算法,其编码性能非常接近于SDQ算法.
简介:为了提高内衬套的检测速度和精度,保证内衬套的使用寿命,提出结合图像处理技术实现内衬套表面缺陷的自动检测.通过采用CMOS相机在近红外背光源暗域照明环境中获取图像并进行处理,实现对内衬套的毛刺及擦痕的自动检测.本检测系统主要通过图像形态学滤波和GrabGut图像分割算法分别实现对内衬套表面毛刺和擦痕的检测,通过轮廓拟合提取检测毛刺和擦痕的图像,从而实现对内衬套的表面缺陷检测.实验表明,所提出的内衬套表面缺陷的自动检测方法具有高效、准确的优点,且该系统运行稳定,因而具有推广价值.
简介:采用基于自由能模型的格子Boltzmann方法,考虑到毛细管数和气液黏性比的影响,模拟了气泡在剪切作用下的动力特性.结果表明,无论气泡半径大小,总是其长轴被拉伸,中轴和短轴被压缩,且中轴的长度总大于短轴的长度.随着毛细管数的增加或气液黏性比的增大,气泡变形和偏转程度越剧烈.
简介:目的:为建立全面评价罗汉果的质量的方法。方法:采用超声强化水提取法进行样品前处理,用罗汉果苷V作为参照物进行指标成分峰的定位,用HPLC对罗汉果水提取物进行分离,比较了水—甲醇、冰醋酸水溶液—甲醇、磷酸水溶液—甲酸、水-乙睛、磷酸水溶液—乙腈、三氟乙酸水溶液—乙腈6种体系的等度、梯度洗脱效果。结果:实验表明在上述6种流动相体系中,以三氟乙酸水溶液—乙腈的洗脱效果最好,色谱条件:梯度洗脱、SinochromODS-BP柱、检测波长为205nm,流速0.8ml/min,柱温25℃。结论:采用HPLC技术,可以得到分离度和重现性均较好的罗汉果水提取物的HPLC色谱图。