所运用技术:C#的网络编程、采集(正则表达式实现)、多线程功能。使用方法:首先在顶点小说网站上找到你要下载的小说,点击全文阅读,然后复制网址粘贴到窗体运行的文本框中,然后输入小说名,点击采集。
使用多线程、线程池技术,使用最新.NET4.0开发配合MSSQL2005数据库提高IO读写速度,保存蜘蛛爬过的历史,能避免采集到重复的Email,避免爬行重复的URL。
ShuFanSocket示例源码功能介绍:多线程侦听客户端连接,异步方式获取服务器与客户端的互相通信消息。适合初学者学习使用。程序已通过测试,没有问题。注意:开发环境为VisualStudio2010
WCF缘分配对源码功能介绍:该源码采用了WCF通信,和多线程的技术,实现了简单的缘分配对功能使用说明:先修改服务端wcfHost源码的地址address为http://本地IP:端口号再修改client
简单搜索引擎源码程序介绍:功能描述:采用lucene.net分词技术,lognet4log日志管理网页爬虫,将搜索到得内容存入数据库,sqlserver