项目结构

技术
后端(python环境)
- 爬虫用到requests,bs4
- 数据分析跟预处理用到pandas
- 后端服务器flask
前端
- 请求数据用到jquery里的ajax
- 绘图用echarts
- 页面有关的用到html5、css
爬虫部分
- 数据来源
数据如何获取
- 获取歌单的页面地址


- 根据获取到的页面地址,爬取页面数据,

- 获取歌单的页面地址
数据预处理
查看对应文件即可
数据分析
对应文件里有5个函数,对应着5个图所需要的数据,这5个函数分别对应5个后端接口,后端接口回调用对应的函数返回数据给前端
- word_cloud_plot_data -> 词云图
- tag_count_rank_bar_plot-> 歌单类型数量柱状图
- every_year_play_list_count_rate_plot-> 年份歌单数量占比图
- tags_collect_mean_rank_bar_plot-> 歌单类型收藏量柱状图
- play_list_radar_plot-> 雷达图
后端接口
提供给前端6个图请求对应的数据接口
flask服务器默认地址加端口号为http://127.0.0.1:5000
所有前端请求后端接口的地址为http://127.0.0.1:5000 + 接口路由地址
ps:接口路由地址

接口函数对应的图表
- word_cloud -> 词云图
- count -> 歌单类型数量柱状图
- mean -> 歌单类型收藏量柱状图
- pie -> 年份歌单数量占比图
- radar -> 雷达图
前端绘图
