通过C#语言.net winform框架实现的网络爬虫软件,网页大数据抓取工具。
McBlog采用伪静态技术,可以自定义为.html等等类型的网页后缀。本博客系统结合魔方采集器,可以实现自动采集文章,无需人工干预。
这是一款用 C# 编写网页采集器。能够有效地从互联网上抓取、处理、分析,挖掘用户感兴趣的数据。小说、新闻、文章、图片等都能有效采集。本程序采用SQLite存储数据,实现多线程断点采集。
这是一款用 C# 编写网页采集器。能够有效地从互联网上抓取、处理、分析,挖掘用户感兴趣的数据。
【注意事项】1.系统默认帐号密码均为:51aspx2.使用本程序的一般步骤:添加项目>>>采集>>>导出设置>>>导出数据3.匹配规则的填写:请先使用规则生成器生
新闻采集器源码完成了对http://info.laser.hc360.com/list/z_news_yw.shtml网页上新闻的采集数据库文件(Sql2005)存放在DB_51aspx文件夹中对网站配置见
【注意事项】1.系统默认帐号密码均为:51aspx2.使用本程序的一般步骤:添加项目>>>采集>>>导出设置>>>导出数据3.匹配规则的填写:请先使用规则生成器生成规则,然后