简介:本文作者从实际应用出发,对现存数据挖掘决策树分类方法进行了研究,并应用到系统当中,实现了决策支持模块。关键词数掘挖掘;决策树算法;改进;实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong(ChangchunTechnologyCollege,Changchun130033,China)AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会产生重要的作用。因此,数据挖掘涉及的学科领域逐渐扩大,数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务,分类算法可以分为决策树分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里,以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例,对决策树分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中,以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集,由于在真实的SQLServer数据库当中,为了降低存储要求和减少存储时间,并非真正存储每个数据项的属性值,而是用存储数字来对应相应的意义,如在数据库的数据表中,“性别”字段中“1”代表“男”、“2”代表“女”,反应到程序页面时再映射回原来的值,为了说理清晰又限于篇幅,这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策树对训练集的每一个属性,计算其信息增益。以“月龄”属性为例,每个结点中的正反例的个数分别为[2,3]、3,2、4,0,分别计算如下info2,3==0.971;info3,2==0.971;info4,0=0;计算信息熵E(月龄)==0.693;计算该属性的信息增益量,选取信息增益最大的属性为节点,按该属性的值划分数据集合Gain(月龄)=Info(9,5)-E(月龄)=0.940-0.693=0.247;同理,对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数(由于篇幅有限,不作计算)。通过对各属性信息增益的计算结果,选择“月龄”属性作为根节点,然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时,“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2,3)-E(注射反应)=0.971-0.4=0.571;Gain(出生状态)=Info(2,3)-E(出生状态)=0.971-0=0.971;Gain(常住地)=Info(2,3)-E(常住地)=0.972-0.951=0.020;同理考虑“月龄>5”的情况,由于“月龄>5”时,各个节点都是纯节点,所以不再划分。三、产生决策规则遍历决策树,输出叶结点类属性值,用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别=是)IF(月龄2…5AND注射反应=轻)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=正常产)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=城市)THEN(类别=否)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=农村)THEN(类别=是)……依此类推,共可产生十三条规则。四、决策支持子系统的分析用上述基于决策树的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类,并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策树是否有效。首先,用整个数据集中2/3的数据作为训练集按照基于决策树的分类算法来建立模型,生成一棵决策树。然后,用余下的1/3的数据作为测试集,通过创建的模型进行预测,并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值,则可以认定该模型对于数据分类是有效的,能够在实际中应用;反之,则认定该模型的分类效果不好,需要按以上步骤来重新判断,直到分类准确率达到预定的阈值为止。在本系统中,经过测试预测准确率已达到87%,在可以接受的范围内,所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰(1980-),女,吉林长春人。长春职业技术学院信息技术分院,教师,讲师,硕士,研究方向为计算机应用。
简介:随着网络技术的发展和Internet应用的普及,互联网已成为人们获取信息的一个重要途径。而越来越多的企业和单位拥有了自己的新闻发布系统。本文主要运用ASP.NET技术框架基于C#语言制作的一个动态网站,数据库采用SQLServer。实现网站新闻的动态管理,使得对信息的管理更加及时、高效,提高了工作效率。关键词ASP.NET;C#;新闻发布系统中图分类号TP311.13文献标识码A文章编号1007-9599(2010)04-0000-02NETNewsPublishingSystem-BasedDesign&ImplementationLiJun(ChengduScience&TechnologyUniversity,InformationEngineeringCollege,ComputerApplicationTechnology,Chengdu610059,China)AbstractAlongwithnetworking'sdevelopmentandtheInternetapplication'spopularization,Internethasbecomeanimportantwayforpeopletogainaninformation.MoreandmoreenterprisesandunitsownNewsPublishingSystem.ThisarticlemainlyutilizedtheASP.NETtechnologyframebasedonaC#languagedynamicwebsite,thedatabasehasusedSQLServer.Realizedthewebsitenewsdynamicmanagement,causestoprompttheinformationmanagementwithhighlyeffective,raisedtheworkingefficiency.KeywordsASP.NET;C#;NewsPublishingSystem一、引言伴随着网络的发展,网页逐渐融入人们的生活。而新闻发布作为网页一个重要的组成部分,也越来越受到企业和单位的重视。能够及时有效的发布新闻,也成为人们追求的目标。随着ASP.NET技术的出现,使得系统的性能有了很大的提高。主要体现在(一)ASP.NET是在服务器上运行的编译好的公共语言运行库代码(二)ASP.NET采用了代码分离技术,使得代码更易于编写,结构更加清晰(三)ASP.NET使执行常见任务变得容易,从简单的窗体提交和客户端身份验证到部署和站点配置二、ASP.NET及C#语言简介ASP.NET是一项微软公司的技术,它是一种建立在通用语言上的程序构架,能被用于一台Web服务器来建立强大的Web应用程序。在ASP.NET中,所有的程序执行都是经过服务器编译的。C#语言是.NET中一种崭新的语言,C#是由C和C++派生而来的一种“简单、流行、面向对象、类型安全”的程序设计语言,C#意在综合VisualBasic的高效率和C++的强大功能。三、系统分析(一)需求分析该系统用户主要有3种用户浏览该新闻的随机游客、新闻录入人员、后台管理人员。通过对这3种用户不同的需求分析,可以把这个新闻发布系统分为如下的3个模块1.前台显示模块按类别显示新闻、最新新闻的发布功能。2.录入模块提供新闻的添加、删除、修改功能。3.后台管理模块主要针对录入人员的管理和新闻类别的管理功能。(二)性能需求分析该系统在性能功能上应达到如下要求1.操作简单、界面友好通过合理的布局使浏览新闻的人对新闻的分类能够一目了然,2.及时高效录入人员对新闻的添加、修改、删除,能够及时准确地显示在页面上。3.具有良好的可扩展性,便于将来新的功能模块的添加。(三)系统的功能模块图通过对新闻发布系统的分析可以列出系统的功能模块图如下四、系统的设计与实现
简介:介绍了DSP的发展状况及应用领域,通过列举大量事实例证对DSP的未来以展望。
简介:该系统基于校园网,采用ASP.NET+SQLServer开发技术,解决了传统人工方式处理学生成绩信息的弊端,实现了学校人力资源的优化和学生成绩信息的科学管理,具有较高的实用价值。关键词学生成绩管理系统;ASP.NET;SQLServer中图分类号TP311.1文献标识码A文章编号1007-9599(2010)04-0000-01Design&ImplementonWebScoreManagementSystemofStudentsChengGuangde(DepartmentofComputerScience,PassCollegeOfChongqingTechnologyandBusinessUniversity,Hechuan401520,China)AbstractThesystemisbasedonthecampusnetwork,usingASP.NET+SQLServerdevelopmenttechniques,tosolvethedisadvantagesoftraditionalmanualapproachtostudentachievementinformation,toachievetheoptimizationforhumanresourcesofschoolsandthescientificmanagementfortheachievementofstudents,hashighpracticalvalue.KeywordsStudentsscoremanagementsystem;ASP.NET;SQLserver随着高等院校招生规模的不断扩大,每学期的成绩管理工作异常繁琐复杂。采用传统完全人工记录、信封发送成绩方式,工作重复量大、错误率高、保密性差、查询复杂,也造成了大量的人力、物力、财力资源浪费。基于此,我院结合实际情况,开发了基于WEB的学生成绩管理系统,有效实现了信息的规范管理、科学统计和快速的查询,对整个校园的信息化建设具有极其重要的意义。一、系统总体设计(一)系统体系结构本系统基于.NET技术,采用标准B/S三层结构进行设计。三层结构包括客户显示层、业务逻辑层、数据层。客户表示层Web浏览器。它负责由Web浏览器向网络上的Web服务器(即中间层)发出服务请求,把接受传来的运行结果显示在Web浏览器上。业务逻辑层Web服务器。采用Windows2003Server搭建,完成各种业务逻辑处理。通过ADO.NET完成数据库的检索或更新操作。数据层采用SQLServer2000。负责管理数据库,接受Web服务器对数据库操纵的请求,实现对数据库查询、修改、更新等功能及相关服务,并把结果数据提交给Web服务器。(二)系统功能模块学生成绩管理系统涉及班级、教师、课程、学生、成绩等基本信息的维护,学生成绩的录入和查询,各类报表的生成和打印,同时还具有录入高效、查询完整等特点,其主要功能模块如下1.学生模块学生登录系统后,可根据需要对自己的信息包括用户名和密码等个人信息进行修改,但限制修改学号、姓名、班级信息。并能根据课程名或学期快速查询本学期成绩、历史成绩、未通过课程情况,以及已修课程学分、已休学位课程学分信息。2.教师模块该模块实现已注册教师对学生成绩的查看、录入、修改操作。(1)成绩录入管理成绩录入涉及到期末考试成绩录入和补考成绩录入。教师登录系统后,系统会自动列出所任教课程与任课班级信息,然后以表格形式批量录入以班为单位的学生成绩,包括平时成绩、考试成绩和期末成绩。录完成绩后,教师可预览该班本课程的成绩汇总信息。(2)学生成绩浏览及修改教师录完成绩后,可通过选择课程名及对应的班级查看成绩信息,并适当对成绩进行修改,但必须设置修改有效期限或经教务人员同意,才有修改学生成绩的权限。3.教务员模块该模块主要实现教师、学生、课程的基本信息维护;任课教师的安排管理;课程成绩的查询和打印;按学期考试成绩自动生成各班成绩汇总表及补考名单等统计分析。(1)学生、教师、课程信息管理该功能模块可根据学生学号、姓名、课程名等关键字进行查询,对学生、教师、课程基本信息进行修改、删除等操作,并能实现各基本信息的批量录入。(2)任课安排管理将教师、学生、课程基本信息录入数据库后,就可以通过下拉框依次选择教师、任教课程和任课班级形成任课教师信息表,从而为教师录入学生成绩模块提供基础数据。(3)成绩查询及统计该模块可根据学号、课程号、班级、学期关键字进行任意组合查询,并生成相应视图报表,提供打印或下载功能。成绩统计分析包括学生个人以及班级成绩单的输出,不及格学生的统计、各科成绩的对比分析、自动生成补考名单、对成绩未达要求的学生提出降级或退学等警戒,并生成相应视图报表,提供打印或下载功能。二、系统的实现ASP.NET程序通过ADO.NET组件对象和ODBC接口来与数据库服务器相连,并取得数据库中的数据。当对SQLServer数据库执行选择查询时,需要先通过SqlConnection对象创建与数据库的连接,然后构造包含查询语句的DataAdapter对象,再通过DataAdapter对象的Fill方法用查询结果填充DataSet对象。当执行插入、更新和删除操作时,可使用SqlCommand对象,通过调用其ExecuteNonQuery方法完成。三、结论学生成绩管理系统采用基于Web模式的ASP.NET与SQLServer技术开发,既方便了教师对学生成绩的维护和统计分析,也方便学生对成绩的查询,有效实现了信息的规范化,科学化,现代化管理,大大提高了学生成绩管理工作效率和水平。参考文献1贾红宇.高校学生成绩管理系统的设计与实现J.教育论坛.2008(9)148-149作者简介程光德(1982-),男,汉族,重庆市合川区人,初级实验师,工学学士,研究方向基于web应用程序的开发,网络管理与维护。