之前发过一个文件,但是上传错误了,所以这一次补上,也算为 论坛做贡献。
今天虽然没有从事原来的技术开发工作,也没有使用 labview来开发软件的需求了,不过现在工作中遇到一些自动化或者重复性高的问题仍然会想到用软件来辅助。
最近就有这样一个小工具的需求,就是对淘宝网卖家的库存、商家编码、ID以及缩略图进行采集便于店家管理库存。其实这里labview只做到了库管的采集工作,并不能算实际意义的库存管理工具。
在做这个工具之前,首先要理清楚步骤
1、打开淘宝网页,并到指定的网页卖家中心的出售中的宝贝
2、将卖家中心的宝贝信息采集下来整理到表格里面
那么使用labview来采集的话就是这样的
1、使用labview的网页浏览控件打开淘宝网,并转到指定的出售中宝贝的页面
2、将网页信息变成html的字符串形式,便于搜索(最笨的办法)
3、搜索这个字符串,根据网页源码内的字段信息,提取宝贝信息
这里的第一步比较简单,难的地方是在网页变成html
我在这个地方卡住了两天,最后解决了,先看一下我的工具截图(涂抹隐私信息),比较简陋。
程序框图内已经指出的关键所在,网页浏览器控件的document属性输出的其实是一个指针,需要通过变体转换为html,变体的数据类型就是html,所以这个类型是关键。我所上传的附近程序内就是解决这个问题的程序。
我搜索了很多天都无法找到html的变体类型。最后在NI的官方论坛上看到外国人也在讨论这个mshtml的LIB如何使用,并且看到了这个一个文件,经过测试完全可用。
因此我将它应用到我的工具内
html变体类型将指针转化为html,文档内所有元素均可以被查询到,而我只是使用了将body转换为字符串便于搜索
这个网页抓取所使用到的变体类型是很多人都在找,而且论坛内也有很多人在找,所以,遇到这个问题而不得的,拿去用吧
8
评分
-
查看全部评分
|
|
|
|
666666666666666666666666666666666666666666
|
|
|
|
|