大数据背景下数据挖掘技术在公安侦查中的应用

(整期优先)网络出版时间:2019-02-12
/ 2

大数据背景下数据挖掘技术在公安侦查中的应用

曾日金

桂林长海发展有限责任公司广西壮族自治区桂林市541001

摘要:经济的发展和科技的进步,促进云计算、人工智能等技术的兴起。对于新兴技术应用领域的开拓,已经成为一个国家发展的重要战略方向。将新兴技术应用到公安侦查领域,成为公安侦查领域强有力的技术支持。本文就大数据背景下数据挖掘技术在公安侦查中的应用展开探讨。

关键词:大数据;数据挖掘;公安侦查

引言

近年来,随着我国改革开放和现代化建设的不断深入,社会政治、经济和科技得到了迅猛的发展。与此同时,违法犯罪的动态化、组织化、职业化、高智能化和高科技化趋向越来越明显,经济犯罪侦查(以下简称经侦)工作出现了许多新情况、新问题、新挑战,带有时代特征的新的犯罪形式和犯罪手段层出不穷,网络犯罪、破坏金融管理、金融诈骗、侵犯知识产权、扰乱市场秩序等大案要案的发案率不断提高,现代违法犯罪行为进入了一个高发期和提速期,违法犯罪的深刻变化对公安警务改革、执法效率、犯罪控制、防范战略和侦查谋略等提出了严峻挑战,各级经侦部门迫切需要在信息技术支撑下建立能适应新形势的工作机制,提高工作效率,以适应形势发展对工作提出的新要求。信息技术已在公安工作中广泛应用,各级经侦部门在实际工作中积累了海量的内部及社会数据和信息。但是,这些宝贵的信息资源大多数还停留在增、删、改、查等传统的初级信息应用层面。

1数据挖掘技术

(1)人工神经网络。人工神经网络是一种模仿生物神经网络结构和功能进行数据信息处理的数学模型,由类似于人类大脑神经元的处理单元所组成,这些处理单元也被成为节点。神经元节点通过网络彼此互连进行数据的建模以及数据的计算和分析。人工神经网络是基于生物神经网络功能所设计的,具有一定程度的判断能力和决策能力,并通过数学统计学的方法进行优化,从而实现数据的统计分析和用来提供人工感知领域的决策支持。该网络是一种自适应系统,能够根据外界不同的数据信息改变自身内部的网络结构以适应数据建模的需要,通过主动式地学习和总结归纳从而进行推理分析。人工神经网络具有自适应、自组织和实时学习等特点。(2)决策树。决策树是用来辅助决策的决策支持工具。通过所获取到的已知数据建立一颗决策树,可对这些数据进行决策分析判断,从而可为决策者提供辅助性决策。决策树的建立过程也就是数据规则的一个生成过程,即决策树实现了数据规则的可视化。在具体实现上,使用决策树算法按照已制定好的决策模式对各种数据进行分类,并通过类似树状的决策结构将其构造出来。决策树为决策者提供了结构清晰的推理框架,帮助其了解掌握各种数据之间的内在联系,从而为进一步的分析及处理提供了决策依据。决策树具有容易理解、效率高以及精确度准等特点。(3)聚类分析。聚类分析是指将物理对象或抽象对象的集合划分成相似的多个对象类的分析过程。其中每个对象类中的数据对象彼此相似,而不同对象类的数据对象则具有很大的相异性。聚类分析的目标就是将相似的数据进行统一分类进而加以分析。依据数据对象的不同特征,对其进行聚类分析,可以减少数据对象的数量,并通过对同一对象类中相似数据的共性特征和不同对象类中数据的不同特性进行整体性统计分析,得出问题模型的一个或多个可能的解,从而提供给决策者作为决策依据。聚类分析具有适用于没有先验知识的分类、多个变量条件的分类和探索性分析法等特点。(4)遗传算法。遗传算法是借鉴自然选择和遗传学机理、通过模仿自然界生物进化机制而设计的随即全局搜索和优化的方法。遗传算法根据生物学的相关方法将问题模型抽象为由多个个体所组成的种群,并构造出种群再将种群放入整个问题模型的大环境中,对种群中的每个个体进行度量和计算机适应度,根据适者生存和优胜劣汰的遗传学原理,对种群中的所保留下来的个体进行选择、交叉、组合和变异等操作,从而优化生成新的下一代种群。在新的种群中同样采用上述过程进行循环式进化操作,直至种群能够适应问题环境并与其保持一致,即为求出了问题的最优解。遗传算法具有智能式搜索、渐进式优化、全局最优解和通用性强等特点。

2基于数据挖掘的犯罪分析

2.1人员特征分析

人员特征主要指的犯罪人员的基本信息和与案件相关的有效信息,在对犯罪人员的侦破过程中,要准确的掌握这些信息才能更好的进行案件的开展。而采用数据挖掘技术应用在犯罪特征的收集和鉴别上,对案件的侦破有着重大的帮助,采用数据挖掘技术时,主要采用的是碰撞式的分析方法,碰撞式的分析方法首先在大量的与案件相关的信息中,找出这些信息之间的共同点,对人员特征进行连线式的摸索,然后对这些共同点进行分析和归纳,最终挖掘出与犯罪相关的人员特征,运用碰撞式分析方法对犯罪人员的特征进行挖掘其基本的原则就是对证据与案件相关信息的吻合度、生活轨迹和案件特征的重合度或相似的人与案件之间内在联系的紧密度等来判断犯罪嫌疑人。

2.2关联分析

关联分析是用于发现隐藏在大型数据集中的有效联系,所发现的规则可以用关联规则或频繁项集的形式表示。关联规则的强度可以用它的支持度和置信度度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含X的事务中出现的频繁程度。大多数挖掘关联规则的问题可以归结为挖掘频繁项集,关联规则挖掘任务分解为如下两个主要的子任务:(1)找出所有的频繁项集:其目标是发现满足最小支持度阈值的所有项集,这些项集称作频繁项集。(2)由频繁项集产生强关联规则:其目标是从上一步发现的频繁项集中提取所有满足最小支持度和最小置信度的规则,这些规则称作强规则。

2.3轨迹分析

轨迹分析是办案过程中常见的分析方法,提取犯罪人员在案发现场遗留下来的犯罪痕迹或者活动痕迹,然后从这些犯罪痕迹中挖掘对用的犯罪信息,并最终根据这些信息锁定最终的犯罪人员并实施调查和抓捕,达到侦破案件的最终目的。这种方法的运用,依赖于众多情报系统,在众多情报系统中确定犯罪行为的各个时空点,为侦破案件提供线索。调查犯罪人员可能遗留下来的犯罪信息,然后对收集到的海量信息进行分析,提取有效信息,实现案件的侦破。这种分析方法能够为案件带来突破性的进展,是侦查工作中最受欢迎的方法。

2.4维度分析

维度分析的任务是确定分析所需涉及的变量。一般来说集资诈骗犯罪分析主要涉及人员的基本属性和案件属性两方面的内容。犯罪嫌疑人基本属性和案件属性直接从公安内部数据库的人员信息表、案件信息表中获取。

3据挖掘技术在公安侦查中的应用分析

对于公安情报部门来说,数据挖掘技术对于大量情报的获取提供了有力的支持,最大程度发挥了数据的有效性。信息提取工作是在众多数据库中挖掘有用的信息,提供给公安部门,找到嫌疑对象的活动方式,为打击犯罪提供信息支持。公安部门根据数据信息的准确性来判断案件的具体情况,实现破案模式的转变。在公安情报分析中运用数据挖掘算法、聚类算法的关联规则,结合侦查特点,利用已存在的大量不同维度的数据,以此来掌握实时的情报状况。

结语

结合公安部门实际工作情况,加深对数据挖掘技术在公安侦查分析中应用的认识,使公安部门认识到公安工作的重要性。尤其是在科学技术日益发展今天,只有充分利用信息化数据技术,才能充分发挥公安侦查数据分析工作的功能,从而提高案件侦破的效率。

参考文献

[1]郑廷.基于领域本体的数据挖掘技术在贿赂犯罪侦查中的应用[J].中国检察官,2016.

[2]李冬.关联规则在公安情报数据挖掘中的应用研究[J].福建电脑,2018.