课程简介:

本门课程将通过Python编程语言和爬虫技术,针对天猫和京东平台上的胸罩销售数据进行深入分析。课程旨在探索中国女性胸部大小的分布情况,并利用Python技能树进行数据分析和可视化。你将学习到如何使用Python爬虫抓取相关数据,并将其保存到本地SQLItE数据库中。随后,你将利用Pandas库进行数据清洗和分析工作。课程将涵盖各种分析内容,如罩杯尺寸的销售比例、不同平台上的购买比例、罩杯和上胸围的综合统计以及哪种颜色的胸罩最受欢迎等。
课程目录:
1. 胸罩销售记录与胸部大小的关系
2. 分析天猫胸罩销售数据
* 抓取天猫胸罩销售数据(包括Cookie劫持)
* 将数据转换为字典对象
* 编写通用函数获取指定商品的销售数据
* 开始抓取指定商品的所有销售数据
* 将数据保存到SQLite数据库中
* 抓取商品搜索页面中的商品ID
* 抓取多个胸罩商品的销售数据
3. 分析京东胸罩销售数据
* 抓取京东胸罩销售数据
* 将数据转换为字典对象
* 编写通用函数获取京东胸罩产品的销售数据及最大页数
* 开始抓取京东胸罩销售数据并保存到数据库
* 抓取京东多个胸罩商品的ID及销售数据
4. 数据清洗
* 清洗罩杯数据
* 清洗上胸围数据
* 清洗胸罩颜色数据
5. 数据分析与可视化
* 使用SQL语句分析罩杯销售比例
* 使用Pandas和MatpLot进行数据分析及可视化
* 直接使用复杂的SQL语句和视图进行分析
* 对比天猫和京东的罩杯销售比例分析
* 按上胸围分析胸罩销售比例并对比两大平台数据
* 综合统计罩杯和上胸围并进行数据可视化
* 分析哪种颜色的胸罩销量最佳
* 分析不同罩杯的女性对黑色胸罩的需求情况
6. 课程完结:罩杯与上胸围分布【盒状图与直方图】
