编辑:[db:作者] 时间:2024-08-24 23:18:45
3.实现流程
def index_main(self, word): print('step1, open page....') #利用selenium,打开页面,获取指数数据所在页面 page_source = self.search_index(word) print('step2, get data....') #解析原网页,获取purchase_index_1688, supply_index, purchase_index_tb purchase_index_1688, supply_index, purchase_index_tb = self.data_parser(page_source) #以本地文件的办法保存结果,分别写入到purchase_index_1688, supply_index, purchase_index_tb三个文件中 self.output_data(word, purchase_index_1688, supply_index, purchase_index_tb) print('step3, %s finished....'% word)
def demo(): ali = AliIndex() search_word = '连衣裙' ali.index_main(search_word) demo()
5.效果展示
将得到的数据文件,进行本地可视化,效果如下:
7.总结
1、阿里指数的采集较为大略,1)阿里指数直接将历时数据写在前端页面中,可以直接解析得到。2)无需用户登录。2、阿里指数与百度指数不同,其对应的关键词实体须要对应到详细的行业或商品上,而用户查询的关键词具有多样性,这样会导致可能无法精确获取严格的关键词商品指数,如搜索iphone,会得到电子产品的指数。3、比较遗憾的是,阿里指数只供应以查询当日为结束如日,往前推一年为开始日期的数据,对付历时数据的构建来说,不是太方便。
项目码源见文末[项目链接跳转] (https://blog.csdn.net/sinat_39620217/article/details/131975141)
更多优质内容请关注公号:汀丶人工智能;会供应一些干系的资源和优质文章,免费获取阅读。
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/rsq/23483.html
上一篇:开门红!南通今年首个百亿级项目落地“云签约”新加坡高德电子
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com