江苏《12577智能数据处理》自学考试大纲:课程性质与课程目标
2015-06-15 09:54
来源:江苏省教育考试院
高纲1524
江苏省高等教育自学考试大纲
12577 智能数据处理
南京信息工程大学编
江苏省高等教育自学考试委员会办公室
Ⅰ 课程性质与课程目标
一、课程性质和特点
本课程是针对物联网工程专业开设的专业必修课,是为从事科学研究、理论研究、工程实践提供基本知识储备和基本训练的基础理论性课程。本课程以工程化手段为特点介绍设计处理、分析和应用方法与技术,是物联网工程学科的重要内容、核心与趋势。课程以“设计-知识-服务”为主线,以数据的智能处理、分析和服务的代表性方法与技术为重点。围绕着主线,重点讲述了关系数据库的设计与查询优化,信息检索与Web搜索引擎、XML数据管理、数据挖掘与数据仓库、Web服务等。通过本课程内容的学习,能够使学生对数据的处理、分析和服务的工程化方法有较为系统和完整的理解。以这些内容作为对智能数据处理技术的代表和延伸,旨在传递概念、方法和技术内涵与理论,为学生进一步学习和研究面向数据科学的方法和技术提供支撑。
本课程的目的主要是培养学生对数据科学研究的兴趣和数据处理的初步能力。培养学生分析数据与处理数据的基本能力,并提高数据服务实践应用的能力。通过本课程的学习,将使得学生能够从工程的角度理解数据科学:它包括了数据处理技术,以及数据分析技术和数据服务技术;既有数据查询和优化、事务和工作流管理及数据库架构等基层内容,也包括数据挖掘与知识发现、时空数据、元数据和社会数据分析等经典问题,另外还包括概率数据、云计算和大数据管理等前言课题。最后,通过本课程的学习,还将加深物联网工程专业的学生对本专业基本理论的理解及科学解决各专业相关问题的能力。
二、课程目标
1. 要求学生能够全面、深入理解和熟练掌握数据处理的基本技术,掌握结构化、半结构化和结构化数据的存储、查询和优化方法。了解数据挖掘、知识发现和数据仓库的概念和结构。了解Web服务的基本概念。
2. 要求学生把握数据科学领域的前沿,通过课程的学习能够尝试追踪层出不穷、内涵日益丰富、热点不断演变的数据科学。
3. 要求学生能够从工程化的角度去掌握数据科学,对“数据(Data)-知识(Knowledge)-服务(Service)”这一数据科学与工程领域研究和应用的趋势和主线能够有清晰的认识。了解信息技术的核心和未来发展的方向即为基于数据的网络信息服务。
三、与相关课程的联系与区别
本课程先修课程应涉及计算机文化基础、计算机程序设计、数据结构、管理信息系统、数据库原理与应用、计算机网络等。后继课程有算法设计、信息系统分析与设计、操作系统、软件工程等。
本课程与其他课程的区别为:本课程立足于理论,且与实际环节紧密结合,需要更多关注各种网络应用及新技术。
四、课程的重点和难点
课程的重点之一是关系数据库查询优化技术,包括数据库设计、面向复杂应用的数据查询、基于索引的查询优化、基于数据库模式反规范化和视图物化的查询优化、基于数据查询语句重写的查询优化;重点之二是信息检索,包括信息检索的基本原理、信息检索模型的形式、布尔模型、向量空间模型、经典概率模型、文本信息检索中的文本洗预处理、文本信息的倒排索引、布尔检索、相关反馈和提问式扩展、Web信息检索、信息检索评价指标;
课程的次重点是XML数据管理,包括XML简介、XML数据模型和XML解析;次重点之二是数据挖掘,包括数据挖掘概念和数据清理;次重点之三是数据仓库,包括数据仓库概念和体系结构。
课程的一般重点是Web服务,包括Web服务的基本概念和Web服务技术架构等。
课程的难点是几种信息检索模型、文本信息检索和Web信息检索。
Ⅱ 考核目标
本大纲在考核目标中,按照识记、领会、简单应用和综合应用四个层次规定其应达到的能力层次要求。四个能力层次是递升的关系,后者必须建立在前者的基础上。各能力层次的含义是:
识记(Ⅰ):要求考生能够识别和记忆本课程中有关数据处理(包括数据库、信息检索、XML数据管理)、数据分析(包括数据挖掘、数据仓库)、数据服务(Web)的概念性内容(如基本概念、定义、定理、背景知识、特性等),并能够根据考核的不同要求,做正确的表述、选择和判断。
领会(Ⅱ):要求考生能够领会和理解本课程中关于关系数据库查询优化、信息检索、数据挖掘和数据仓库的概念及特性的内涵及外延,理解数据库设计的概念、信息检索的原理,XML语法基本知识、XML数据模型和XML解析,能够鉴别关于概念和特性的似是而非的说法;理解相关知识的区别和联系,并能根据考核的不同要求分析各种不同领域所使用的数据处理和分析技术。
简单应用(Ⅲ):要求考生能够根据已知的计算机知识和数据库技术对ER模型进行处理,转化为关系模型;能够对基于索引的查询优化、基于数据库模式反规范化和视图物化的查询优化、基于数据查询语句重写的查询优化进行简单分析,考虑其性能优劣和可靠性。能够利用Web搜索引擎的基本原理来分析其关键技术,对其中的信息检索的性能进行初步的评估。此外,还可运用本课程中的少量知识点,利用简单的模型分析和解决一般应用问题,如简单的计算和验证检索效率及其他性能指标等。
综合应用(Ⅳ):要求考生能够处理具体、实际的数据处理技术,能探究解决问题的方法,并进行推导。对数据库查询优化,能够综合三种优化方法,选择合适的优化途径;对信息检索,能够利用文本信息检索中的倒排索引和布尔索引的方法来分析文本信息检索的解决途径。在深入理解和熟练掌握数据库查询优化内容和信息检索内容的基础上,能够在数据处理的基础上提升到数据分析和数据服务的层面,能够对数据处理技术举一反三。