武汉大学研究生课程-数据挖掘-2021级研究生试题

发布时间:2023-12-28 17:32:42   来源:文档文库   
字号:
武汉大学研究生课程-数据挖掘-2021级研究生试题

武汉大学计算机学院
2021级研究生“数据仓库和数据挖掘”课程期末考试试题
要求:所有的题目的解答均写在答题纸上,需写清楚题目的序号。每张答题纸都要写上姓名和学号。
一、单项选择题(每小题2分,共20分)
1、下面关于数据仓库的叙述中(B )是错误的。 A.OLAP分为ROLAPMOLAPHOLAP
B.星型模式下的维表是规范化的,而雪花模式下的不需要规范化 C.在查询效率方面,星型模式效率更高
D.在事实星座模式中有多个事实表,且它们共享相同的维表
2、下面关于维的叙述中( C)是错误的。 A.维是人们观察数据的特定角度 B.维的层次性是由观察数据细致程度不同造成的
C.“某年某月某日”是时间维的层次 错(“某年某月某日”是在时间维上位置的描述 D.“月、季、年”是时间维的层次 对(日、月、季、年是时间维的层次) 3、可以对按季度汇总的销售数据进行( B),来观察按月汇总的数据。 A.上卷 B.下钻 C. D.切块 4、可以对按城市汇总的销售数据进行(A ),来观察按国家汇总的数据。 A.上卷 B.下钻 C.切片 D.切块 5、将原始数据进行集成和变换等处理是在以下C)步骤的任务。 A.频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘 6当不知道数据所带标签时,可以使用( B)技术促使带同类标签的数据与带其他标签的数据相分离。
A.分类 B.聚类 C.关联分析 D.隐马尔可夫链 7、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的( C)任务。
A.根据内容检索 B.建模描述 C.预测建模 D.寻找模式和规则 8、利用信息增益方法作为属性选择度量建立决策树时,已知某训练样本集的4个条件属性的信息增益分别为:G(收入=0.940位,G(职业=0.151位,G(年龄=0.780位,G(信誉=0.048位,则应该选择(A )属性作为决策树的测试属性。 选信息增益最大的 A.收入 B.职业 C.年龄 D.信誉
9、以下关于前馈神经网络的叙述中正确的是(C)。 1

A.前馈神经网络只能有3 B.前馈神经网络中存在反馈
C.前馈神经网络中每一层只接受来自前一层单元的输入 D.以上都是正确的
10、以下(A )不是影响聚类算法结果的主要因素。 A.已知类别的样本的质量 B.聚类结束条件 C.描述属性的选取 D.对象的相似性度量
二、(20分)假定某大学教务部门已经建立有教务管理系统,现在要创建一个数据仓库,至少包含以下分析功能:
1)分析全校各个专业各个省份学生的基础课程成绩为优秀的人数情况。 2)分析全校各个专业中年龄在16岁以下学生的人数情况。 3)分析全校各个学院所有课程的不及格的人数情况。 完成如下任务: 1)根据你的思考设计该数据仓库的模式图,包含每个维表和事实表的结构。(15分) 2)指出你设计的数据仓库属于哪种模式。5分) 三、(20分)某个食品连锁店每周的事务记录如表1所示,每个事务表示在一项收款机业务中卖出的商品项集,假定min_sup=40%min_conf=40%,使用Apriori算法生成的强关联规则。 ppt 5-5.1apriori算法)
1 一个事务记录表 事务 1 2 3 4 5 项集 面包、果冻、花生酱 面包、花生酱 包、牛奶、花生酱 啤酒、面包 啤酒、牛奶 解:(1)由I={面包、果冻、花生酱、牛奶、啤酒}的所有项目直接产生1-候选C1,计算其支持度,取出支持度小于supmin的项集,形成1-频繁集L1,如下表所示: 项集C1 {面包} {花生酱} {} {啤酒} 支持度 项集L1 支持度 {面包} 4/5 4/5 {花生酱} 3/5 3/5 {牛奶} 2/5 2/5 {啤酒} 2/5 2/5 (2组合连接L1中的各项目,产生2-候选集C2计算其支持度,取出支持度小于supmin的项集,形成2-频繁集L2,如下表所示: 项集C2
支持度 项集L2 支持度 2
{面包、花生酱} 3/5 {面包、花生酱} 3/5 至此,所有频繁集都被找到,算法结束,
所以,confidence{面包}→{花生酱}=4/5/3/5=4/3> confmin confidence{ 花生酱}→{面包}=3/5/4/5=3/4> confmin 所以,关联规则{包}→{花生酱}{ 花生酱}→{面包}均是强关联规则。
四、(20分)对于如表2所示的决策表(U,C∪D,C={abcd}D={ e },回答以下问题:
1)求POSC(D,判断该决策表是否是协调的。(10分) 2)采用分辨矩阵求其所有相对属性约简和核。(10分)

本文来源:https://www.2haoxitong.net/k/doc/3157cf52ce22bcd126fff705cc17552706225ecb.html

《武汉大学研究生课程-数据挖掘-2021级研究生试题.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式