搜索

一下部分通过后裔采集器来爬取京东电脑的基本信息

电脑是人们日常办公中不可缺少的东西。想通过EXCEL技巧分析一下京东电脑的基本情况。

第一部分使用后代收集器爬取京东电脑的基本信息。爬取的基本信息有四部分:价格、名称、评价次数、店铺名称。

如图所示,共爬取了4807条数据并导出到Excel。

第二部分数据分析

数据分析的基本步骤: 1. 提问;2. 了解数据;3、数据清洗;4. 建立模型;5.数据可视化

提问 哪种类型的电脑卖得最好?哪家店的销量最好?大多数人对电脑的价格定位是什么?数据清洗

数据清洗步骤

1.选择一个子集京东好评模板,即隐藏原始数据中不相关的列,保留名称、价格、评论数、店铺名称一下部分通过后裔采集器来爬取京东电脑的基本信息,调整列宽,换行并调整顺序。也就是选择列+shift键。

2.栏目改名了,这里评论数改为sales作为参考。

3. 删除重复数据。根据项目名称的唯一表示去除重复值。

Excel中函数的使用

在这种情况下,left() 函数和 find 函数用于将销售额从字符数据转换为数值数据

语法为 =LEFT(D3,FIND(“10,000”,D3)-1)*10000;

如何自动填充整列?

首先按ctrl+shift+方向键选择整列,再按ctrl+D完成整列的自动填充。

通过数据过滤函数可以用#value查找错误,也可以使用left()函数和find()函数解决真值错误的问题,语法为=LEFT(D121,FIND(“+ “,D121)-1) 。

构建模型描述性统计

要对商品价格进行描述性统计操作,点击数据转数据分析,然后点击描述性统计,然后选择列数。下图是关于价格的描述性统计。

数据透视表分析

概括:

1)通过数据透视表京东好评模板,我们可以发现苹果iPad平板9.7英寸(128G WLAN版)Gold and /A是京东最畅销的电脑【包版】;

2)那么苹果产品京东旗舰店是卖电脑最好的店;

3)大部分人电脑的价格定位在2498-5488之间;

© 版权声明
THE END
喜欢就支持一下吧
点赞12赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码

    暂无评论内容