课程编号: 课程性质: 通识教育选修课
课程名称:大数据时代 学时/学分:32/2
英文名称: Big data is interesting 考核方式:研究报告
选用教材:自编讲义 大纲执笔人:涂然、周学进、曾怡
先修课程:自然科学与技术 大纲审核人:李远
适用专业:全校师生
一、教学目标
大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。本课程为大数据技术入门课程,试图为学生搭建起了解和应用大数据技术的桥梁和纽带。
课程主要向学生构建初步知识体系,阐明基本原理,介绍相关应用,引导初级实践。讲授内容包括大数据的基本概念、处理结构Hadoop、相关数据库等;以及Python、R等常用编程语言。同时贴近生活,介绍大数据在互联网、公共安全、旅游、游戏设计等各个领域的应用。在Hadoop、Python等重要章节,安排入门级的实践操作,让学生更好地学习和掌握大数据关键技术。通过本课程的学习,希望学生能够建立对大数据知识体系的轮廓性认识;了解大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展;了解云计算、物联网的概念及其与大数据之间的紧密关系;了解大数据处理架构的基本原理和编程方法。
二、教学基本内容
本课程主要分为两个主部分:第一部分为讲解篇章(1-6章)主要为数据科学与大数据原理及相关技术方法的介绍与教学,旨在引导学生了解大数据科学的基本理论,并熟悉入门级的实践操作;第二部分行业应用与实践指导篇章(7-10章)主要介绍目前大数据在主流领域,如互联网、智慧城市、公共安全、旅游等行业中的发展情况与特点,鼓励学生组成兴趣小组,展开针对性研究与实际操作,完成大数据分析行业报告。另外第三部分为课堂互动与拓展讲座篇章,本课程拟邀请相关行业专家在课程后期进入课堂,为同学提供真实大数据分析与研究的实战案例,并对各个兴趣小组的课程报告进行点评与指导。
第一部分
第一章 数据科学概述
[主要内容]回顾数据科学的发展史,介绍其中的一些典型时间节点和代表科学家,并引出大数据概念;介绍日常生活中接触到的数据科学。
[重点] 数据的概念和数据科学的发展历程。
[难点]无
要求学生:积极参与讨论,结合自身学习、社会生活分析数据科学的应用。
第二章 大数据综述
[主要内容]介绍大数据的基本概念和应用领域,并简要阐述大数据、云计算和物联网的相互关系。介绍大数据应用的软件和硬件要求。
[重点] 大数据的概念和对其它领域重要性。
[难点]大数据与云计算等热门概念的相互关系。
要求学生:查阅搜索资料,了解大数据的主要应用场景和技术限制。
第三章 大数据处理架构
[主要内容]介绍大数据一般处理架构和数据库,以Hadoop为主介绍其发展历史、重要特性和应用现状,Hadoop项目结构及其各个组件,以及Hadoop平台的安装和使用方法。
[重点]Hadoop平台的安装和使用方法。
[难点]大数据处理流程,数据库构建方式。
要求学生:安装Hadoop平台并学会简单实用方法。
第四章 Python语言编程和应用
[主要内容]Python语言编程入门讲解,介绍Python在数据分析和统计中的应用,并列举其在大数据处理中的实例。
[重点] Python语言的基本语法、逻辑和编程方法。
[难点]Python实际编程。
要求学生: 积极动手实践,掌握Python简单程序的编写和调试。
第五章大数据的主流算法与云计算简介
[主要内容]介绍大数据挖掘常用的方法,如分类、回归分析、聚类、关联规则、神经网络方法、Web 数据挖掘等。并以Web数据挖掘为重点,给出其应用方法。介绍云计算的基本概念,以及云计算平台部署和管理方式,引出基于云计算的大数据方法。介绍国内主流云计算服务平台,分析其技术特点和异同。
[重点] 云计算的概念和与大数据科学的关系,各种数据处理方法的差别和适用范围。
[难点]云计算平台的使用方法。
要求学生:积极讨论和查阅资料,给出特定算例要能迅速选择出合适的数据挖掘方法。云计算以了解为主,但要积极搜索资料并讨论国内几个大公司在云计算和大数据技术上的特点。
第六章大数据的可视化处理
[主要内容] 分类介绍函数与公式数据可视化工具,地图数据可视化工具,金融(股票)数据可视化工具等,以及网络爬虫大数据可视化处理方法。结合实际应用案例,分析大数据可视化如何改变着人类的对信息的阅读和理解方式。
[重点]大数据可视化的处理方法,信息的解读方式。
[难点]应用工具处理大数据。
要求学生:积极讨论和查阅资料,选取自己感兴趣部分,深入调研,给出调研报告。
第二部分
第七章 互联网+大数据
[主要内容] 以百度、腾讯和阿里巴巴为例,介绍大数据互联网领域的应用。分析其数据资产、数据场景和未来发展策略。
[重点] 大数据在互联网的应用中的流程和作用。
[难点] 理解互联网中海量数据获取方式和处理方法。
要求学生:积极思考,举一反三,分析各大公司的大数据资源的特点和发展状况。
第八章智慧城市+大数据
[主要内容]剖析大数据与智慧城市之间的关系,探讨在大数据时代利用大数据技术推动智慧城市建设与促进智慧城市大数据技术发展的方式方法。实例讲解大数据给经济、医疗、体育等涉及城市发展重要领域的影响。
[重点] 理解大数据如何推动智慧城市建设和发展。
[难点]智慧城市中的大数据分析。
要求学生:结合自身学习和生活经验,对大数据对智慧城市建设提出一些建议。
第九章 公共安全+大数据
[主要内容]实例讲解大数据给公共安全管理领域带来思维方式的变革。介绍大数据技术如何在城市安全设计中的心理安全设计、行为安全设计、防卫安全设计、灾害安全设计、公共健康设计这五个方面的应用。
[重点] 理解大数据如何推动安全治理体制机制的不断创新。
[难点]城市安全信息数据的收集和分析方法。
要求学生:结合自身学习和生活经验,对大数据在公共安全领域应用提出一些建议。
第十章智慧旅游+大数据
[主要内容]依托课题组目前在做的智慧旅游项目,介绍大数据在旅游领域的应用,着重以智慧、文化、生态三者综合分析大数据的优势和作用。
[重点] 大数据、云计算和智慧旅游的建设与发展。
[难点]通过数据对旅游信息智能感知、方便利用。
要求学生:选取感兴趣的部分,自行收集资料,参与到智慧旅游项目中。
第三部分
专家讲座与分组汇报
本部分教学安排将充分发挥教学团队优势,由三位教师分别指导兴趣小组在课程教授环节中开展实际行业调查分析,并鼓励学生跨专业、跨学科、跨校区进行课程,在报告撰写中给予充分指导,并邀请行业专家进行专题讲座与报告点评,结课后还可挖掘具有潜力的项目指导学生参与后续创新创业课题的申报。
三、建议教学进度
课程内容 |
授课学时 |
第一章 数据科学概述 |
2 |
第二章 大数据综述 |
2 |
第三章 大数据处理架构 |
2 |
第四章 Python语言编程和应用 |
3 |
第五章大数据常用算法与云计算简介 |
2 |
第六章大数据可视化大数据在公共安全领域的应用 |
2 |
第七章互联网+大数据 |
4 |
第八章智慧城市+大数据 |
3 |
第九章公共安全+大数据 |
2 |
第十章旅游+大数据 |
2 |
业界专家讲座(不定期) |
2 |
小组汇报与讨论 |
4 |
课程回顾与整理 |
2 |
合计 |
32 |
四、考核方式
提交研究报告或者论文
五、成绩评定方法
平时成绩40%(主要为个人成绩),报告成绩60%(主要为小组成绩)
六、教学参考资料
[1] 《大数据时代》 ,维克托·迈尔-舍恩伯格等,浙江人民出版社,2013
[2]《自己动手做大数据系统》,张魁等,电子工业出版社,2016
[3] 《零基础学大数据算法》 ,王宏志,电子工业出版社,2016
[4] 《白话大数据与机器学习》 ,高扬等,机械工业出版社,2016
[7] 厦门大学大数据在线课程:http://www.icourse163.org/course/ XMU-1002335004
[8] Coursera: Big Data Specialization. https://www.coursera.org/ specializations/big-data
[9]《智慧城市大数据》,李光亚等,上海科学技术出版社,2016.
其他参考资料:行业大数据分析报告。