当前位置:首页 > 实用范文

数据开题报告多篇

时间:2025-03-30 08:53:45
数据开题报告多篇

【导读】数据开题报告多篇为网友投稿推荐,但愿对你的学习工作带来帮助。

【第1篇】数据挖掘技术论文开题报告

数据挖掘技术综述

数据挖掘(data mining)是一项较新的数据库技术,它基于由日常积累的大量数据所构成的数据库,从中发现潜在的、有价值的信息——称为知识,用于支持决策。数据挖掘是一项数据库应用技术,本文首先对数据挖掘进行概述,阐明什么是数据挖掘,数据挖掘的技术是什么,然后介绍数据挖掘的常用技术,数据挖掘的主要过程, 如何进行数据挖掘,主要应用领域以及国内外现状分析。

一. 研究背景及意义

近十几年来,随着数据库系统的广泛流行以及计算机技术的快速发展,人们利用信息技术生产和搜集数据的能力大幅度提高。千万个数据库被用于商业管理、政府办公、科学研究和工程开发等,特别是网络系统的流行,使得信息爆炸性增长。这一趋势将持续发展下去。大量信息在给人们带来方便的同时也带来了一大堆的问题:第一是信息过量,难以消化;第二是信息真假难以辨认;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。面对这种状况,一个新的挑战被提出来:如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?这时出现了新的技术——数据挖掘(data mining)技术便应用而生了。

面对海量的存储数据,如何从中发现有价值的信息或知识,成为一项非常艰巨的任务。数据挖掘就是为迎合这种要求而产生并迅速发展起来的。数据挖掘研究的目的主要是发现知识、使数据可视化、纠正数据。

二. 概述

1,数据挖掘

数据挖掘(data mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的,可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行

数据自身的维护。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,可以集成数据数据库、人工智能、数理统计、可视化、并行计算等技术。 2,数据挖掘技术

数据挖掘就是对观测到的数据集进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。它利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。

数据挖掘的过程就是知识发现的过程,其所能发现的知识有如下几种:广义型知识,反映同类事物共同性质的知识;特征型知识,反映事物各方面的特征知识;差异型知识,反映不同事物之间属性差别的知识;关联型知识,反映事物之间依赖或关联的知识;预测型知识,根据历史的和当前的数据推测未来数据;偏离型知识,揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决策的需要。

数据挖掘是涉及数据库、人工智能、数理统计、机械学、人工神经网络、可视化、并行计算等的交叉学科,是目前国际上数据库和决策支持领域的最前沿的研究方向之一。

3,数据挖掘的功能

数据挖掘通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,按其功能可分为以 下几类。

3.1 关联分析(association analysis)

关联分析能寻找到数据库中大量数据的相关联系,常用的一种技术为关联规则和序列模式。关联规则是发现一个事物与其他事物间的相互关联性或相互依赖性。

3.2 聚类

输入的数据并无任何类型标记,聚类就是按一定的规则将数据划分为合理的集合,即将对象分组为多个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而在不同簇中的对象差别很大。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。

3.3 自动预测趋势和行为

数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。。

3.4 概念描述

对于数据库中庞杂的数据,人们期望以简洁的描述形式来描述汇集的数据集。概念描述就是对某类对象的内涵进行描述并概括出这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

3.5 偏差检测

数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。这常用于金融银行业中检测欺诈行为,或市场分析中分析特殊消费者的消费习惯。

三.目前的研究现状及存在的主要问题

自kdd一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议以来。迄今为止,由美国人工智能协会主办的kdd国际研讨会已经召开了13次,规模由原来的专题讨论会发展到国际学术大会,人数由二三十人到超过千人,论文收录数量也迅速增加,研究重点也从发现方法逐渐转向系统应用直到转向大规模综合系统的开发,并且注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。其他内容的专题会议也把数据挖掘和知识发现列为议题之一,成为当前计算机科学界的一大热点。

与国外相比,国内对dmkd的研究稍晚,没有形成整体力量。1993年国家自然科学基金首次支持我们对该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。其中,北京系统工程

研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造;南京大学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及web数据挖掘。

四. 研究内容

1, ……此处隐藏8671个字……息化的步伐,使各项管理更加规范化。 2.1面向对象

该网站主要面向的对象是所有有需求的用户,本院的学生都可以在其上面下载课件,在线测试和留言。该网站的系统管理员可以进行用户管理,系统信息的维护等工作。老师则拥有权限可以上传课件,上传和发布作业,查看学生提交的作业,查看学生在线考试的分数记录,回答学生留言板的问题。该网站也不排除其他人员对网站的访问,同样可以对该网站自由的访问和操作。

2.2课程背景

随着计算机在中国的广泛普及,数值化管理手段的逐步完善,越来越多的学生逐渐习惯于是用信息化手段进行学习信息,这样也方便的老师使用信息化手段对学生进行管理。而信息化应用在教学管理中的应用是实现教学管理科学化、现代化的关键。因此,该网站为本书店提供了搞笑,准确,快速的管理模式,实现管理规范化、科学化。

3、项目概述

3.1网站需求分析

中国教育历来有重视质量的传统,形成了一整套行之有效的方法,要组织力量进行深入研究并加以发扬光大,形成中国教育的独特优势。同时要积极探索提高教育质量的新思路、新途径。树立科学的质量观,形成评价教育质量的新标准。坚持全面推进素质教育,把“成人”与“成才”作为教育质量的根本标准,职业教育和高等教育要把社会和就业市场的认可程度作为衡量教育质量的重要标准。这个标准要根据各级教育的特点予以细化。深化教育教学改革,推动各级各类教育的.培养模式、课程体系、教学内容和教学方法的改革与创新,利用新的方法和技术革新。特别是把教育的信息化作为提高教育质量的新手段,不仅是把硬件系统建立起来,更重要的是要在教学中广泛地应用起来。 3.2网站构架

前台主要包括导航栏(首页、相关新闻、课程标准、电子教案、教学课件、测试题库、课程论坛)、公告栏(包括公告通告、学校要闻、相关新闻、热帖、管理员登入)。

后台包括信息管理(包括信息管理、公告管理)、课件管理(包括课件的添加管理、显示管理)、回复管理(帖子的回复管理、删除管理、热帖的显示管理)、管理员管理(查看会员信息、查看留言及回复)、权限管理(管理员增加、管理员修改、管理员删除)。

3.3主要内容及功能:本网站系统功能主要分为五大类:

(1)教学大纲和通知部分:教学大纲单独设计页面。通知和新闻发布部分在要在首页显示,发布通知是管理员的权限。

(2)课件发布系统:管理员可以发布课件,课件管理。老师可以上传课件。学生可以下载网上发布后的课件。

(3)作业发布系统:老师可以上传作业发布,学生可以下载作业,管理员拥有管理作业和删除以前老师发布的作业权利(防止积累过多)。

(4)网上测试系统:在线自测(题目全为选择题),有题库管理系统随机生成,每套题目有50道题目组成,在试卷的管理中随机生成的试卷分等级比如分简单和较难的试题(这些要在生成前学生选择的)

(5)论坛系统学生可以提交问题,然后由老师或者其他同学进行回答。学生对问题进行回复,编辑,删除等操作在管理员对其进行检查后显示,老师可以及时进行解答。

(6)实训案例系统:管理员可以发布作品和管理。老师可以上传一些学生的优秀作品,学生可以下载发布出的作品。

本系统性能力易于使用,具体有较高的扩展性和可维护性。这就需求数据库结构能充分满足各种信息的输入与输出,实现有组织地动态地存储大量关联数据,方便用户访问系统中的数据,它与文件系统的重要区别是数据的充分共享,交叉访问,与应用程序的高度独立性。

4、项目特点

该网站是一个操作使用简单,界面漂亮美观的网站。具有以下特点: (1)简洁美观的操作界面

简单的操作界面能够大大的提高用户的操作速度,从而提高服务效率,使顾客节约一定的时间。因此美观又简单的操作界面使用户感觉舒适,该网站通过专业美工的精心打造,与学校网站具有相同的风格,给用户带来亲切感,从而避免在视觉带来的异样。 (2)科学的管理模式

系统采用科学的管理模式,管理员可以更好的了解用户需要什么,替用户轻松的完成需要整理信息:结构化管理模式,涵盖了新闻管理、电子教案编辑、用户管理、教学课件管理等等,为该网站的电子化管理提供了一套良好的管理模式。 (3)对外的开放性

通过数据库课程网站,比较低的成本实现优质教育教学资源的共享,打破现有的教育教学质量受制于教学资源不足的瓶颈,通过免费为师生提供优质教育教学质量。

(4)信息的整体性

数据库课程包括了教师、学生教材、教学技术手段、教学制度等要素。教学课程建设要考虑完整的课程建设的各个环节,即课堂授课水平、教与学的互动、学生课余的自主学习和实践动手的培养、学业成绩的评价以及教学辅助手段和教学参考书的建设等,要抓住个方面间的关系,关注整体建设而不是局部建设。 (5)师生的互动性

通过建立健全课程网站评价体系,即有效的反馈机制的建设,通过比较校内、校外、甚至国外专家、同行、学生在利用课程网站的建设方案,调查和补充课程

的教学内容,强化课程建设者与使用者的的互动建设,这是课程建设的一条必备的途径,同时也是一条捷径。

5、实施方案

(1)网站设计方案分析

本网站设计的方案采用dreamweaver开发工具进行开发,使用asp.net技术编写,数据库使用sql server2005数据库。并且本网站有较好的导航,以便读者浏览。可行性分析、需求分析、流程设计、搭建系统、建立数据库、前台界面设计,后台开发,系统测试,维护,。此管理系统具有易安装、成本低、可扩充、、用户使用ie浏览器就可以使用。当需要对网站进行修改,只需系统管理员进入后台修改,网站内容有较好的检索设计,有简明的网页题目和反应主题的关键字,以增大被检索的概率,网页有较好的可读性,篇幅和版面效果比较适宜,网站能满足用户网上获取相应信息的目的。 开发平台及运行环境

操作系统:本系统是在microsoft sql server2005、dreamweaver8、microsoft visual studio 2005等。

6、工作进度

参考文献

宁国利.课堂网站建设的几点思考 青年教师学报. 2007(6). 65-67

杨祥,刘海波,刘璞 c程序精品课程网站开发设计 通化师范学校学报. 2010年31(10)

[3] 徐磊. 网页制作和网站建设技术大全.北京:清华大学出版社.2008年. 21

[4] 张景峰. asp程序设计(第2版). 北京: 高等教育出版社. 2010年. 32

[5] 杨志. dreamweaver+asp网页编程. 北京:电子工业出版社. 2008年. 260

[6] 胡孟杰, 郑延斌, 岳明. javascript动态网页开发案例指导. 北京:电子工业出版社.2009年.1-2

你也可以在搜索更多本站小编为你整理的其他数据开题报告多篇范文。

《数据开题报告多篇.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式