Lesson 1
数据分析与统计学
课程内容:
本节课通过几个经典的历史案例了解了数据分析的应用场景,学习了如何通过观察分析统计图表得到有用的信息,并初步了解了一些生活中常见的统计学陷阱。
知识点:
1. 数据分析的应用场景
2. 可视化分析
3. 统计学陷阱
4. 数据分析的常用库
5. 数据分析的步骤
Lesson 2
Numpy库和数据结构
课程内容:
本节课初步了解Numpy和Pandas的数据结构,并初步熟悉了Spyder的编程界面操作,重点学习了ndarray这个数据结构。
知识点:
1. Numpy和Pandas的数据结构
2. Spyder的使用
3. ndarray的创建
4. ndarray的访问和修改
Lesson 3
Series和DataFrame
课程内容:
本节课了解了Series和DataFrame的内在联系,以及如何创建Series对象和DataFrame对象,重点学习掌握访问、修改、删除和根据条件筛选数据。
知识点:
1. Series和DataFrame的联系
2. Series和DataFrame的创建
3. Series和DataFrame的数据获取和修改
4. 数据的删除和条件筛选
Lesson 4
数据处理与分组
课程内容:
本节课主要了解什么是数据处理,学习了数据处理的主要步骤和方法,最后通过一个案例综合运用知识点。
知识点:
1. 数据处理
2. 数据合并:Merge
3. 数据拼接
4. 数据清洗
5. 数据分组:Goupby
Lesson 5
Matplotlib库下的pyplot模块
课程内容:
本节课主要学习matplotlib库下的pyplot模块,学习图表的基本属性,最后通过案例学会绘制一个完整的图表。
知识点:
1. Matplotlib库介绍
2. pyplot模块学习
3. 图表的基本属性
4. 绘制折线图
Lesson 6
绘制常用的图表
课程内容:
本节课在上节课的基础上学会如何选择恰当的图形,并学会绘制常见的图表。还介绍Pandas库绘图,以及与Matplotlib库的相关性。
知识点:
1. 图形的选择
2. 常用图表的绘制
3. 利用Pandas库绘图
4. Pandas库和Matplotlib库绘图的相关性。
Lesson 7
pyecharts的使用
课程内容:
使用pyecharts结合wxpy库读取微信个人信息,分析微信好友的性别比例和地域分布
知识点:
1. 漏斗图Funnel
2. 仪表盘Gauge
3. 地图Map
4. 结合wxpy绘图
Lesson 8
泰坦尼克号的秘密
课程内容:
本节课通过分析当初泰坦尼克号上乘客的存活率与性别、舱位等因素的关系,来熟悉整个数据分析的具体流程
知识点:
1. 数据分析基本步骤
2. 数据获取
3. 数据处理
4. 数据可视化
Lesson 9
三国演义文本分析
课程内容:
通过分析《三国演义》中各个人物的出场次数,判断谁是主角
知识点:
1. jieba分词
2. sort排序
3. 横向柱状图barh
Lesson 10
分析豆瓣影评
课程内容:
利用爬虫爬取豆瓣网某部电影的短评,并根据相关内容绘制词云以及数据图
知识点:
1. 爬取数据
2. wordcloud库的使用
3. 词云制作和数据可视化
Lesson 11
空气质量分析(上)
课程内容:
本节课通过复杂度更高的综合项目学习数据分析的整个流程,重点讲解了空气质量分析这个项目的数据获取和数据处理部分
知识点:
1. 问题如何定义
2. 数据获取
3. 问题数据的处理
Lesson 12
空气质量分析(下)
课程内容:
本节课重点讲解了如何从问题出发,挖掘数据里隐藏的趋势和规律,并用可视化图表直观地呈现出来
知识点:
1. 可视化分析的流程
2. 空气质量等级对比分析
3. 月度趋势对比分析