学科分类
/ 16
318 个结果
  • 简介:数据对文件归档工作产生的影响集中表现在归档概念模糊、归档范围的扩大化和归档管理思维的多样。厘清概念、辩明关系、划定范围、转变观念是应对大数据对文件归档工作影响的要求。主动适应新环境、学习新知识、运用新技术、掌握新技能、创造新方法、解决新问题,是应对档案职业环境变化的不二法则。

  • 标签: 大数据 文件归档 归档 归档工作 影响
  • 简介:在软件行业中,五年就像是一个地质时代。五年前,Microsoft宣布了自己的Micorsoft.NETFramework计划。从那以后,DataSet(数据集)才开始作为关键对象出现在基于.NET的应用程序中,执行多种数据相关的任务。也是五年前,DataSet被誉为ADO记录集(Recordset)的威力增强版。那么在.NETFramework出现之前,您是如何设计数据访问层(DAL,DataAccessLayer)的呢?我想您一定是以ADO和它全能的Recordset对象——断开的、且可进行XML序列的——为中心构建数据访问层。

  • 标签: 数据集 FRAMEWORK RECORDSET对象 DATASET MICROSOFT 数据访问层
  • 简介:近年来,随着数据交换的发展,HTML因其难以扩展、交互性差等缺陷严重阻碍了数据交换前进的脚步。而KML凭借简单、规范、平台无关性、自描述性等优势在数据交换技术中得到了广泛的应用。本文采用KML技术完成了一个数据交换系统,实现了异构数据的交换,达到了信息共享的目的。

  • 标签: XML 数据交换 异构数据
  • 简介:本文作者从实际应用出发,对现存数据挖掘决策树分类方法进行了研究,并应用到系统当中,实现了决策支持模块。关键词数掘挖掘;决策树算法;改进;实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong(ChangchunTechnologyCollege,Changchun130033,China)AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据技术的不断发展及数据管理系统的广泛应用,数据中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据中抽取出来,将会产生重要的作用。因此,数据挖掘涉及的学科领域逐渐扩大,数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务,分类算法可以分为决策树分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里,以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例,对决策树分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中,以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集,由于在真实的SQLServer数据当中,为了降低存储要求和减少存储时间,并非真正存储每个数据项的属性值,而是用存储数字来对应相应的意义,如在数据数据表中,“性别”字段中“1”代表“男”、“2”代表“女”,反应到程序页面时再映射回原来的值,为了说理清晰又限于篇幅,这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策树对训练集的每一个属性,计算其信息增益。以“月龄”属性为例,每个结点中的正反例的个数分别为[2,3]、3,2、4,0,分别计算如下info2,3==0.971;info3,2==0.971;info4,0=0;计算信息熵E(月龄)==0.693;计算该属性的信息增益量,选取信息增益最大的属性为节点,按该属性的值划分数据集合Gain(月龄)=Info(9,5)-E(月龄)=0.940-0.693=0.247;同理,对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数(由于篇幅有限,不作计算)。通过对各属性信息增益的计算结果,选择“月龄”属性作为根节点,然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时,“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2,3)-E(注射反应)=0.971-0.4=0.571;Gain(出生状态)=Info(2,3)-E(出生状态)=0.971-0=0.971;Gain(常住地)=Info(2,3)-E(常住地)=0.972-0.951=0.020;同理考虑“月龄>5”的情况,由于“月龄>5”时,各个节点都是纯节点,所以不再划分。三、产生决策规则遍历决策树,输出叶结点类属性值,用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别=是)IF(月龄2…5AND注射反应=轻)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=正常产)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=城市)THEN(类别=否)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=农村)THEN(类别=是)……依此类推,共可产生十三条规则。四、决策支持子系统的分析用上述基于决策树的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类,并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策树是否有效。首先,用整个数据集中2/3的数据作为训练集按照基于决策树的分类算法来建立模型,生成一棵决策树。然后,用余下的1/3的数据作为测试集,通过创建的模型进行预测,并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值,则可以认定该模型对于数据分类是有效的,能够在实际中应用;反之,则认定该模型的分类效果不好,需要按以上步骤来重新判断,直到分类准确率达到预定的阈值为止。在本系统中,经过测试预测准确率已达到87%,在可以接受的范围内,所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰(1980-),女,吉林长春人。长春职业技术学院信息技术分院,教师,讲师,硕士,研究方向为计算机应用。

  • 标签:
  • 简介:数据系统是对象存储的核心,也是云存储系统架构和保障的重中之重。本文将分上下两篇,试图通过汇集在云存储系统的研发和运营实践中获得的知识和经验,探讨如何建立和保障一个元数据系统,以便为对象存储系统建立坚实的基础。

  • 标签: 对象存储系统 元数据系统 保障 架构
  • 简介:某加热炉需要对32个温度检测点进行巡回检测,对此进行硬件电路设计并进行数据采集系统的主程序及子程序的编写,通过硬件和软件的设计,实现对32路温度数据采集。

  • 标签: 32路温度 数据采集系统 设计 实现
  • 简介:2014年开年,那些在2013年狠狠火了一把的众多科技趋势在明年或许将继续壮大,比如云计算、大数据、平板电脑以及物联网等。对此,市场研究机构IDC对这些科技趋势明年的发展趋势及“钱景”进行了预测。

  • 标签: 科技 计算 升温 平板电脑 发展趋势 研究机构
  • 简介:我国的电子政务建设过程中,各部门积累了大量的信息资源,但这些数据资源以不同的格式分布在各个部门的业务系统中,形成了一个个“信息孤岛”,造成了资源浪费的现象。针对这种情况,本文参照《政务信息资源交换体系》总体框架的要求,利用面向服务的思想设计了数据交换平台,以实现各部门数据信息的互联互通,达到资源共享的目的。文章从数据平台的体系结构、技术架构、组织结构以及数据交换模式等方面详细介绍了数据交换平台的设计。

  • 标签: 数据交换 XML 面向服务
  • 简介:摘要对学生进行档案的管理,对很多学校来说已经不是新鲜事情了,但是如何能够最大程度上的利用计算机系统进行管理,并且这些管理的数据存储方面的要点是本文要去解决的关键。文章是从为什么要对学生管理系统如此重视开始谈起的,重点对数据存储的重要性进行了分析。

  • 标签: 数据管理 档案系统 重要性
  • 简介:昆士兰大学的昆士兰脑研究所在澳大利亚率先为存储网络部署博科第六代光纤通道技术SupportingtheBigDataEnvironmentinQueenslandBrainInstituteDemand澳大利亚昆士兰大学的昆士兰脑研究所成为澳大利亚第一家迁移到博科第六代光纤通道存储网络解决方案的机构。博科G620交换机为昆士兰脑研究所提供其所需的速度和性能,消除数据瓶颈,

  • 标签: 昆士兰大学 数据环境 光纤通道 网络解决方案 存储网络 Queensland
  • 简介:印度南部安得拉邦当局计划在监狱内设立外包机构。该机构将拟招200名受过教育的囚犯去从事文职工作,诸如数据输入和信息加工处理。在接下来的4个月里,这一项目将在靠近邦首府的Charlapally中心监狱首先运行。

  • 标签: 数据输入 印度 外包 雇佣 加工处理 机构
  • 简介:信息技术的发展推动了档案事业的发展,而数据挖掘技术在档案管理系统中的应用是为了提高档案利用率,实现档案服务的必然。本文从数据挖掘技术的相关内容入手,论述了数据挖掘技术的基础知识,并结合数据挖掘技术在档案管理系统中的具体应用进行了分析与探讨。

  • 标签: 数据挖掘技术 档案管理系统 档案事业
  • 简介:上海集装箱码头有限公司(简称SCT,网址)是由上海港集装箱股份有限公司与香港和记黄埔上海港口投资有限公司共同投资组建的,是全国交通系统第一家合资企业。现拥有宝山、张华浜、军工路3个国际集装箱专用码头,其集装箱吞吐量在2000年即已达295万标准箱,比上年增长13.7%。为了适应不断扩大的业务需求,

  • 标签: SCT 决策支持系统 数据仓库 数据管理 数据库 CA
  • 简介:商业信息系统的建设是一个复杂的系统工程,它的应用能否达到系统的预期目的,并不仅仅体现在是否采用了先进的信息处理设备上,而更多体现在商业信息系统建设的体系结构上,这种体系结构更多的体现在对数据结构体系的建设上。很大程度来说,一个商业应用系统的成功与否取决于基于数据的建设是否成功。SQLServer2000作为建大型商业应用的最佳的核心引擎数据之一,也是基于微软技术的商业应用解决方案的核心。

  • 标签: 商业数据库 数据为中心 数据挖掘 商业信息系统
  • 简介:伴随计算机技术的不断发展进步,而各种不同的计算机软件由于开发商不同,其数据结构也各种各样,假如用户需要操作两套或者两套以上的软件,需要根据计算机提供对应的格式基础,按照计算机软件保留各种格式的数据结果,这样无形中就增加了用户的工作量,并且软件处理流程链也容易中断。而计算机软件的数据接口可以很好的解决这类问题。本文就针对计算机软件数据接口的应用进行分析研究。

  • 标签: 计算机软件 数据接口 应用
  • 简介:摘要由于计算机应用的飞速发展,很多单位都存在多个业务处理系统。这些业务处理系统是在不同时期因不同业务需要独立建立起来的,不可避免地产生“信息孤岛”现象。这种情况下,改变原有的异构、分散和孤立的基础架构、重新构筑一个全新的技术架构的“信息整合战略”应运而生。

  • 标签: 数据仓库 数据整合技术 物化视图
  • 简介:数据访问如何保护数据连接字符小将数据连接字符串(DatabaseConnectionString)置于weh.config中的〈connectionStrings〉,然后通过受保护的配置提供程序之一(RSA或DPAPI)对〈connectionStrings〉进行加密。

  • 标签: ASP.NET 通信安全 安全策略 Connection 数据库连接 CONFIG
  • 简介:“Web服务”(WebServices)可谓是当前最炙手可热的IT词汇之一.受到业界的高度关注。Web服务的历史渊源可以追溯到组件体系结构。产生于20世纪80年代的组件技术最初是在图形用户接口(GUI)的上下文环境中被开发的——他们今天仍然是多数GUI体系结构的核心.

  • 标签: WEB服务 体系结构 “Web GUI 图形用户接口 组件
  • 简介:在高度数字的今天,数字图书馆已经成为很多人查询资料的有效途径。然而即使在畅通的宽带搜寻中也一样会出现堵塞.但是这种堵塞可能并不是因为网络造成的,而是由于个人电脑的软件配置。就读国际关系学院的研究生韩小姐对此颇有感触:“在查找资料时,面对繁多的数据格式,由于手头的工具太少,使得大量的文件无法打开,只好望而兴叹。”据了解,有韩小姐这种想法的用户不在少数。

  • 标签: 红樱枫软件公司 文本转换 市场 纯文本抽出程序库 文字处理软件