PC版
搜索导航
论文网 > 教育论文 > 学科教育论文

现代数据仓库教学存在的问题

  在当今的信息时代,数据时刻以指数方式增长,人们每天都在不知不觉中与形形色色的数据打交道,如银行查询取款、电话通讯等。然而在这个数据大爆炸时代的背景下,如何利用这些信息和数据,并从这些数据中提炼出帮助人们选择和决策的信息,成了当今社会的一门重要科学;当然也成了当今高校的一门重要课程和研究方向(数据仓库与数据挖掘)。因为数据仓库是建立在数据库基础上的一门科学,而且理论与实践都较复杂,所以一般在本科高年级或者研究生才开设此专业和课程。我从数据仓库原理特点出发,探讨了当前数据仓库原理课程教学中存在的一些问题及解决策略。
  一、教学内容不统一
  因数据仓库是一门新型科学技术,教学目标和教学大纲要求没有明确的要求,因此该专业的课程选择非常广泛,各高校教学侧重点有所不同。
  由于数据仓库的主要特点是强调解决现实生活中的问题,这样课程安排和教学的内容必须贴近行业需求,说白了就是让学生在就业时有好的选择,因此,该专业对学生的实践、动手能力的要求标准非常高。目前,我接触的大多数数据仓库理论课程,虽然注重实用技能,但教学方法仍然停留在传统基础上,有很大比例的教学内容是围绕原理展开,对实际应用和操作能力的要求远远不够,因此,对在原有课程内容继续进行调整,使设置课程的基本原则建立在将数据仓库理论与现实生活实践相结合的基础上,并使学生自由选择课程内容,使不同专业方向的学生有选择地培养动手能力,同时通过调整理论课和选修课的比例,获得符合自身发展方向的知识。
  事实上,尽管数据仓库的技术发展飞速,但基础理论是相对稳定的,也就是说,数据仓库的基本理论是变化不大的,因此,在进行教学时要保持教学大纲基本稳定,而课程内容设置时,努力将基本理论扩展到操作实践中,使学生在掌握数据仓库理论的基础上更理解实践中为何要这样设计,并且推陈出新。
  二、教材的选择存在的问题
  数据仓库教材,无论是对教师还是学生来讲,都有不可替代的作用,它是该课程教学内容的主要依据,教材的不同,直接影响教学方法的实施。目前,市面上的数据仓库教材形式多种多样,根据学生对职业规划侧重点的不同,基本教材可分为原理教材、实践应用型教材和理论与应用型教材。对学习数据仓库的学生而言,仅仅学习理论,与应用脱钩显然是不行的,因此,大多数高校选择应用型教材或者理论和应用相结合的教材,但这样笼统地选择仍然是不够的。根据数据仓库的特点,学生专业方向有很大不同,目前存在的专业方向大致有数据过滤、数据抽取、数据建模、数据报表等,因为专业方向的不同直接影响学生的未来就业,这无疑增加了教材选择的难度,同时,同一类型的教材无法满足不同学生的需求,编纂者无法把教学内容涵盖所有的理论和实践。
  以上都是教材选择面临的问题,要通过简单选择不同类型的教学材料显然是不能够解决所有问题的。这就要求教师在教学过程中,尽量选择和补充符合专业和专业方向所需要的材料,同时通过改变教学方法,使教学内容更具有突出的针对性和实用性。
  三、教学设计存在的问题
  教学设计就是指课堂教学的设想和计划,这对数据仓库这门课来讲非常重要,因为数据仓库原理的复杂性且技术本身还在不断更新,简单地采用课题实录、过程呈现或者导学案例只会使课堂索然无味。
  我认为数据仓库教学设计应该在以下几个方向设计:
  1.营造氛围,借机提出问题
  一堂课的气氛很重要,导入课题更重要,在数据仓库的教学中要精心设计导入语,做到一上课就牢牢地吸引学生的注意力,并激发学生的学习兴趣。
  2.加强与学生的探讨、互动
  在课堂合适的时机,加强与学生的互动,引用不同的案例,使学生在老师的引导下,充分发挥主动性与能动性,提高自我解决问题的能力,这对学习数据仓库这门课来讲很容易做到,同时建议老师采用这种教学方式。
  3.解释、概括
  某些老师不重视这个环节,通常比较简单或没有。建议:不能忽视,将这个环节上出一定的特色。很多老师在这个环节略微带过,其实这部分很重要,所谓老师的职责“传道授业解惑也”,在课堂的结尾处,对数据的仓库的精髓进行概括和解释,一般会取得画龙点睛的效果。
  4.当堂训练,巩固达标
  这个环节跟所有的课一样,主要让学生当堂巩固,加深理解。
  四、教学方式、方法要有所侧重
  数据仓库作为一门实践标准要求很高、而理论基础又比较深的课程,在教学目标的设定上对学生提出比较高的要求,不仅要求学生有比较扎实的理论基础,而且要求实践操作能力强。但目前从事教学的教师有丰富项目经验的非常少,这就使这门课教学方法显得单一甚至枯燥,有的学校甚至直接将实践这一非常重要的技能培训直接扔给学生的实习单位;而单一的理论教学,会导致学生缺乏实际的操作经验,不能满足工作的需要,很难达到企业的用人标准,更别说满意。
  因此,为了解决上述问题,我们应该从根源入手,根据教学目标的要求,加强对学生实践技能的培养,这些都需要对教学方式和教学方法进行改革。
  首先在硬件配置方面,给学生提供模拟岗位操作实践环境,通过以理论、应用、培养个人能力为目标的教学方式,让学生在掌握数据仓库理论的基础上,对各种实际的数据仓库开发项目进行分析演练,以达到学以致用的教学目的。同时,在教学方法上和教学过程中,教师要积极引导学生通过各种方式自主设计数据仓库项目,从被动和主动两方面,培养他们学习和实践的能力。下面介绍几种比较合适数据仓库的教学方法:
  1.老师、学生互动式的教学方法
  互动式教学指在教学过程中,学生与老师双方在平等的基础上进行交流、探讨、协商,根据各自依据,彼此讨论、辩解甚至激烈的碰撞,达到以理服人、以事实为依据的教学效果,这种教学方法既能调动学生学习的主动性,又可以拓展学生的创造性思维。   这里我们举一个关于数据抽取的教学方法,当然是先由老师讲解数据抽取的原理、必要性及实现的过程;接着老师就要通过一个具体的简单实例(用SQL来实现)讲解一个具体实现的过程,接着老师可以提出问题,在问题的基础上提出更复杂的案例,由于前面老师已经作了比较详细的案例分析,学生一般都可以通过自己的思考和动手完成这个更复杂的案例,接着老师就可以数据抽取的算法准确性、效率提出问题,并讲解对大型数据进行数据抽取时应该做哪些准备,有经验的老师还可以介绍他们在具体生活中的案例是怎样实现的等,通过这些讲解,让学生深入思考、理解数据抽取的精髓,并开始探讨如何改进现有的案例算法,达到课程循序渐进、逐步理解、到掌握的最高目的。对于一些具体案例,老师还可以通过精彩的视频演示给学生看后,再探讨、再加以理论与现实的引导,从而使学习过程生动、直观,最后使学生实现掌握的目标。
  2.自主学习
  数据仓库是一门理论比较深,高年级或者是研究生才上的课程,因此学习该课程的学生一般都具备良好的信息技术基础,自学能力也比较强,所以,该课程由老师引导,解剖难点后,让学生自主学习是一种很好的教学方法。比如,数据采集与数据清洗部分的讲解,如果老师一味在课程上讲,如何如何,其结果是学生一知半解,或者只有一个印象,但如果把学生分组,老师共同参与讨论,学生在分组讨论中理解为何有些数据必须在归纳在这个维度上,那些数据必须剔除,那些数据是错误的;最终老师做归纳总结。通过这种自主学习的过程,让学生摸索现实项目中存在的问题,老师与学生共同学习、讨论,这样不仅加强了学生对专业知识的掌握,而且锻炼了学生的口才,加强了师生之间的交流。
  3.教师博客、微博与数据仓库教学
  现在上课的时间一般是45分钟,学生要在课题上掌握所有知识是不可能的,因此在课余时间加强与老师的沟通是一种必不可少的方式。目前比较多的方式是E-mail,但该方式功能太过单一。校园网也提供了基于论坛、师生互动等平台,但由于受校园网的限制,应用也不是太广泛。最近兴起了微信等平台,老师可把自己的教学理念、教学日志、教学内容等上传到网上,也可引用国内外优秀资料链接到自己网页上;学生可在老师上微信上留言、讨论、下载等,老师也可随时随地地回答学生的问题,这就极大地丰富了交流的方式,不受空间和时间的限制。
  4.考核方式
  数据仓库这门课目前大多数学校的考核方式还是以期末笔试为依据,这就在一定程度上遏制学生平时学习的动力,大学学生很喜欢的一种方式是期末突击学习,应付考试。杜撰这种弊端,就要调整考核方式,使学生花更多时间在平时积累实践经验上,这里我们可以借鉴一些国外的教学的经验:
  (1)把学生分成很多组(可以自由组合,体现民主),让学生在业余时间完成规定的实验项目;这个作为平时成绩的一个重要依据。
  (2)有条件的学校,邀请一些从这里毕业的老生回来串联,让他们介绍他们实践中的实战经验,并在允许的情况下让学生自愿加入一些项目的开发,这个也可以作为平时成绩加分的参考。
  (3)基于数据仓库的特性,期末考试改为上机开卷考试,在规定时间完成项目的比例,作为评分依据。
  五、在数据仓库不同专业方向讲解的侧重点不同
  1.数据采集,数据清洗
  数据采集是建立数据仓库的第一步,它是保证后面数据挖掘的准确性的保证,在讲解此部分时,要侧重业务流程的讲解,不断地提示学生数据采集时要保证数据来源的准确性与关联性,同时对不用的和不正确的数据进行清洗。在进行案例教学时,尽量选择简单业务流程的案例,同时在案例中举几个例子说明数据来源的重要性及数据清洗的必要性;在案例教学中,还让学生初步理解什么是事实表,什么是维度表等。
  2.数据建模
  数据建模是数据仓库建立的第二步,这一部分讲解较为复杂,首先要让学生理解什么是逻辑表和物理表,理解这两部分可以引用工具教学,市面上的建模工具比较多,选取一款比较流行的(例:ERstudio);事实表和维度表是这部分的重点,要详细讲解,这是学生理解数据仓库后面部分的基石,另外在星系模型、雪花型模型讲解时,可采用类比讲解法,比较为何几种模型存在的必要性。
  3.数据抽取
  数据抽取听起来好像是比较简单的一步,这一部分老师讲解时一般会比较简单,但它是连接实时数据与数据仓库关键的一步,也是技术性要求较高的一步,这部分可以专门作为一门课程讲,老师可选择用SQL/Plus语言讲解,条件好的学校也可以选择比较流行的软件(infomatica等)进行讲解,因为该部分技术性较强,尽量让学生上机训练,安排学生按一定时间完成要求的案例任务。
  4.数据集市
  数据集市是数据仓库子集,主要是把中央数据仓库划分成若干个不同子集,以满足不同部门对历史数据的报告需求。这一部分老师讲解时主要是让学生搞清数据集市与数据仓库概念上的区别。
  5.数据展示
  数据展示对技术、艺术都有一定的专业要求,同时对交流能力也要求很高,这部分老师讲解时可把它分三部分进行。首先在讲解技术时让学生加深对维度表的理解,同时引用一到两款软件,了解数据展示是怎么进行的;在讲解展示的方式时,比较不同类型的报表直觉效果,并向学生强调虽然给决策层提供的数据一样,但不同的展示方式往往取得意想不到的效果,报表尽量做到直观、简单,同时给学生若干个案例,让学生用不同的报表展示方式展示相同的数据进行类比;在讲解对决策层的业务理解需求时,主要是给学生讲解交流技巧,让学生在掌握决策层需求时,头脑中有设计的思路等。
  六、结语
  根据数据仓库发展的现状和目前教学过程存在的问题,本文作者根据自己的工作经验(6年数据仓库工程师,2年高校计算机教学),从理论和实践出发,对这些问题做了简要阐述,以求在以后的数据仓库课程教学中,取得较好的教学效果,使学生在学习这门课中掌握数据仓库的精髓,同时体会到团队和沟通的重要性。随着数据仓库技术的发展和需求的不断更新,数据仓库这课还需要不断深化和探索,最终越来越与现实接轨,并达到提高教学质量的目的。

相关论文

仓库教学数据现代问题
浅谈大数据时代房地产企业新型营销路
试论互联网平台异化导致的伦理问题及
写生课程融入学前教育美术教学的应用
电商直播课程教学融入思政教育构想
企业财务分析存在的问题及对策探讨
课程思政融入“保险学”教学的路径及
浅谈茶文化的旅游管理教学改革模式
高校商务英语教学中的思政融入构想
社会化电商拼多多盈利模式存在的问题
大数据时代拼多多盈利模式研究