每天都是一大堆的数据导出采集
导读:每天都是一大堆的数据导出采集?从什么地方导出来,需要导出来的数据是什么格式的?说不清楚很难给你一个准确的方式的。不过从大多数的情况来看,使用python的话,通用性更高,可个性化的程度也非常高。从网页导出数据到excel可以使用reques...
每天都是一大堆的数据导出采集?
从什么地方导出来,需要导出来的数据是什么格式的?说不清楚很难给你一个准确的方式的。不过从大多数的情况来看,使用python的话,通用性更高,可个性化的程度也非常高。
从网页导出数据到excel可以使用requests库直接下载数据,然后使用xlwings库保存到excel的工作簿中。当然如果数据源提供了接口就更为简单一点,不然就还要用BS4去进行解析数据才能保存。
从别的软件中导出数据先向软件商了解下,是否有公用的接口可以获取到数据,接口的文档也要拿来看一下,然后就照着文档的要求提出申请就行了。
如果没有接口,可以拦截一下封包,看看是不是明文的。如果是的话也可以通过拦截封包获取数据再生成表格。
如果是加密的话,就放弃吧。如果页面是比较干净的那种的话,还能考虑用ocr识别,不过出错的几率还是比较大的,万不得已不要用。
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: 每天都是一大堆的数据导出采集
本文地址: https://pptw.com/jishu/65787.html
