通用网页下载器,悬浮在浏览器上方,主要用于手工摘选、下载网页信息,可以按规则或者自动提取算法获取文章主要信息;正文部分,运用正则表达式进行了处理,过滤了大部分标签,留下的是最干净的网页。
用winform通过正则表达式抓取百度新闻、搜狗新闻、360搜索新闻,用于竞争对手监控和本公司舆情监控;本程序可以在服务器设置任务计划,每天服务器自动运行
该软件是一款对“失信人口网”的数据采集软件,主要采集里面所有失信人口的信息到数据库,可以用于2次开发
客户端涉及的相关功能技术:系统升级检测及更新,自定义皮肤,webbrowser多标签浏览器,58,赶集,搜房,安居客等多个网站自动登录,多个网站发布表单XML配置,脚本解析引擎,XPath,程序发布,图片上传等等等三
新闻阅读器RSS源码源码描述:开发环境:vs2010新闻阅读器RSS+Atom版源码可以手动添加频道,获取相关频道信息界面右侧为展示信息浏览器适合新手研究
因为目前ShootSearch只能处理单个网站的远程采集,所以这里最关键的,“处理规则设置“和”文件名过滤器“。
相关技术1.NET中提供的类来发送HTTPRequest2WebClient类的用法3模拟“GET”方法4Cookie的处理5如何跟HTTPS的网站交互6模拟"POST"方法7客户端发送给服务端的数据进行
仿遨游浏览器源码而事实上该软件还存在很多不足之处:1.收藏夹的功能还没有完善2.控件的美化3.Favicons的处理