首页 [ 学教实践 ] FZL抓取网页数据示例源码
一键分享

FZL抓取网页数据示例源码

  • 免费

2014-04-10 09:07:44

  • 源码类型: C/S
  • 开发环境: VS2012 + 无数据库
  • 开发语言: C#
  • 标签: 数据抓取 爬虫 获取数据
  • 评分:
收藏 207 次|关注 4080 次|下载 819 次

免费


交付物: 源码包
    商家已实名认证
  • 分享者:xiaoh***
  • 访问次数:   38626 次
  • 源码数量:   297 套
  • 通过比率:   66%
  • 活跃于:   三个月前
  • TEL:   15*******45
  • 最新IP属地:北京市
  • 微信扫码咨询
.net

源码介绍

源码参数

  • 源码类别:【学教实践】
  • 源码类型:C/S
  • 适合人群: 进阶
  • 授权类型:免费版
  • 开发语言:C#
  • 数据库:无数据库
  • 源码大小:193KB
  • 相关网址: 【免费浏览】
  • 源码指数:
  • 完整度:
  • 获取数据
  • 数据筛选
  • 最小数据
  • 获取数据
  • 数据筛选
  • 最小数据
  • Aspx.Query.CodeImageQueryModel
  • Aspx.Query.CodeImageQueryModel
  • Aspx.Query.CodeImageQueryModel

FZL抓取网页数据示例源码

源码描述:
网页信息的获取分为两个阶段:
1 知道目标网页和相关参数,并获取网页的源码
2 将获取到的源码抽取出我们需要的信息,并转换成c#对象
在Demo中的HttpHelper.cs文件下的类的职责就是设定目标网页地址和相关参数,该类是在网上找到的,据说可以无视cookie、证书等验证,很牛,推荐小伙伴们使用,所以,第一个目标是比较容易能够完成的
难点在于第二个目标,我们如何抓取html源码(json数据)中的有效信息并转换成我们需要的c#对象呢?Demo中获取的是json数据,然后用正则抓出了其中的一部分,再转换成一个实体类的列表。Demo中的AsyncRegexHelper是异步的正则匹配帮助类,在使用正则匹配的过程中,经常遇到无限回溯的问题,使用这个帮助类可以异步地执行匹配并且有一个超时时间。现在碰到的问题是正则匹配比较不靠谱,难度较大且不易扩展,目前打算想用Html Agility Pack来进行数据的匹配,希望伙伴们能指点下,谢谢大家。

责任编辑:xiao

下载记录(Only Recent 100)

用户名 推荐指数 下载时间

源码评论

单击更换

评论列表

全部评论
  • 暂无评论 …

最近更新

      下载排行