通过C#语言.net winform框架实现的网络爬虫软件,网页大数据抓取工具。
途乐行静态网页,主要是DIV+CSS布局+javascript脚本和jquery
在百度贴吧做SEO推广时,输入百度网盘的分享短链,总会被系统删除,那么就可以使用此工具来对短链进行批量转换为长链,转换后,链接更易于推广及收录。
主要实现了多标签页支持,标签页关闭,查看源码,浏览器打印功能
这是一款用 C# 编写网页采集器。能够有效地从互联网上抓取、处理、分析,挖掘用户感兴趣的数据。小说、新闻、文章、图片等都能有效采集。本程序采用SQLite存储数据,实现多线程断点采集。
这是一款基于三层架构的优秀的手机销售管理系统,功能完整,包含论文,适合于商业应用、毕业设计、课程设计、初学者学习,有需要的朋友可以下载看一下。
在一些实际的应用场景中,有用户需要将一批规范的资料网页保存为WORD文档以便离线传阅或用于其它需求。
通用网页下载器,悬浮在浏览器上方,主要用于手工摘选、下载网页信息,可以按规则或者自动提取算法获取文章主要信息;正文部分,运用正则表达式进行了处理,过滤了大部分标签,留下的是最干净的网页。
使用HttpWebRequest和HttpWebResponse类进行网页获取和正则表达式进行网页分析,分析的网页选择了淘宝网站的几个购物交易网页
本程序采用多线程网页爬虫,对网站进行死链接的检测,主要检测的类型包括 网页链接
