1.采用了flask框架2.采用大数据爬虫的方式,爬取长沙市的房产信息数据,爬取网站是房天下网站3.根据爬取的信息,进行房价的信息分析,以图形的方式进行展示
能自定义写入正则表达式来增加新的网站源网站
该软件可以自动从网上爬取小说到软件中,软件分为 我的书架,书城,搜索和阅读界面。
这里面的亮点是同时使用了silverlight和XNA技术,并且使用了“Mappy”地图制作工具,以及如何使用路径寻找算法,里面的A搜索算法使得这个游戏更有生命力!欢迎感兴趣的用户下载学习
今后有空可能加入的特性:新特性介绍爬取文件用BerkeleyDB存储提高性能:常用操作系统不善于处理大量小文件基于URLRanking的优先级队列主题爬虫:机器学习算法对链接与主题相关度进行评估,并按照得出的优先级顺序进行爬取爬虫礼仪遵循爬虫禁止协议