聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 大数据在教育中的应用

大数据在教育中的应用

时间:2022-12-20 22:59:28    下载该word文档

大数据及其在教育中的应用
陆璟
(摘要目前对大数据的定义有三种,分别从数据体量、复杂性程度、价值这三个角度来界定,反映了大数据三个最主要的特性。大数据在教育领域的主要应用是教育数据挖掘和学习分析。今后要加强多个来源的数据库整合,充分利用在线数据开展教育舆情分析等研究,在确保数据安全的前提下与专业数据公司开展合作。
[关键词]大数据数据挖掘学习分析
一、大数据的定义和类型
1.定义
“大数据”概念第一次创造出来是在200894日,谷歌成立10年前际,《自然》推出了大数据专辑,包括8篇大数据专题文章加上1篇编者按。虽然该专辑并没有直接提出大数据的定义,但是从互联网技术、网络经济学、超级计算、环境科学、生物医药等多个方面介绍了海量数据带来的挑战。概括而言,科学研究产生的数据集越来越大,并且数
据越来越复杂,使得研究人员都转向依靠数据挖掘工具、在线的团队合作(如维基百科)和复杂的可视化技术。每年的研究数据聚合起来形成了大数据资源,依靠研究者自身去花大量精力记录和管理数据已经跟不上发展,科学研究数据的长期管理和维护需要有大机构的支持。但是政府、社会机构对此还没有充分认识,文化还跟不上数据的发展。这组文
章的目的是引起各方面对数据管理和分析的重视,指出充分利用数据实际上是需要额外建设大量基础设施、需要经费和资源支持、需要建立标准、需要工具和培训、需要专业的数据支持服务的。


目前对大数据的定义有三种,分别从数据体量、复杂性程度、价值这三个角度来界定什么是大数据。
第一次提出大数据的定义并且估计大数据的商业价值的是全球著名咨询公司麦肯锡。2011年麦肯锡全球研究院发布了《大数据:创新、竞争和生产力的下一个新领域》研究了数据和文档的规模,同时分析了处理这些数据能够释放出的潜在价值。麦肯锡对大数据的定义是从数据集的“大体量”手的:大数据是指那些规模大到传统的数据库软件工具已
经无法采集、存储、管理和分析的数据集。麦肯锡故意采用了主观的定义,没有定义多大的数据集才是大数据,所以这个定义中的“大”是动态的概念。他们的假设是,随着技术的进步,随着时间的推移,符合大数据界定的数据集大小也将增加。还有,不同部门对大数据的界定也可能不同,这取决于他们通常用什么软件,以及某个特定产业的数据库是多大的。在考虑这些因素后,许多部门的大数据规模将从几十
TB到多个PB(几千个TB。维基百科采纳了麦肯锡的定义,认为大数据是一组庞大而复杂的数据集的集合,大且复杂到难以用现有的数据库管理工具或传统的数据处理应用来处理。我国学界也采用了这一定义。
德勤咨询技术负责人罗伯特·福莱对大数据的定义是从“复杂性程度大”人手的。他在2012提出,过去对大数据的界定主要基于规模,而实际上,规模并不是常规数据和大数据的关键区别。对大数据的定义是:有用的数据源排列数量巨大,使有用的查询非常困难,并且,复杂的相关关系使得排除很困难。大数据的第一个属性是复杂性,大不是数量大,而是复杂性更大。例如一架飞机上有10万个传感器,产生的数据流要查询起来非常困难,但它的规模可能没有想象的那么大,1小时的飞行中产生的数据不到3G。而有些数据集很大,例如媒体流,生成量非常大,但是它的结构并不复杂,现在的搜索引擎和数据库工具可以很快将它解析出来。所以媒体流只是数据数量大,但复杂性程度却没有飞机传感器产生的数据那么大。大数据的另一个属性是很难删

免费下载 Word文档免费下载: 大数据在教育中的应用

  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服