雨田多线程爬虫采集软件SEO文章采集器,网络应用|行业软件|上传下载,Asp.net源码

bin
- Debug
  - app.publish
    - YutianArticle.exe[603KB]
  - config
    - urls
      - 37_urls.txt[16KB]
      - 39_urls.txt[28KB]
      - 40_urls.txt[509KB]
      - 41_urls.txt[467KB]
      - 42_urls.txt[52KB]
      - 43_urls.txt[28KB]
      - 44_urls.txt[33KB]
      - 45_urls.txt[26KB]
      - 46_urls.txt[61KB]
      - 47_urls.txt[43KB]
      - 48_urls.txt[199KB]
      - 49_urls.txt[320KB]
      - 50_urls.txt[244KB]
      - 51_urls.txt[14KB]
      - 52_urls.txt[216KB]
      - 53_urls.txt[51KB]
      - 54_urls.txt[563KB]
      - 55_urls.txt[10KB]
    - urls2
      - 37_urls.txt[16KB]
      - 39_urls.txt[28KB]
      - 40_urls.txt[509KB]
      - 41_urls.txt[467KB]
      - 42_urls.txt[52KB]
      - 43_urls.txt[28KB]
      - 44_urls.txt[33KB]
      - 45_urls.txt[26KB]
      - 46_urls.txt[61KB]
      - 47_urls.txt[43KB]
      - 48_urls.txt[199KB]
      - 49_urls.txt[320KB]
      - 50_urls.txt[244KB]
      - 51_urls.txt[14KB]
      - 52_urls.txt[216KB]
      - 53_urls.txt[51KB]
      - 54_urls.txt[563KB]
      - 55_urls.txt[10KB]
    - db.mdb[416KB]
    - task.json[10KB]
  - db.mdb[796KB]
  - HtmlAgilityPack.dll[131KB]
  - Newtonsoft.Json.dll[528KB]
  - YutianArticle.application[1KB]
  - YutianArticle.exe[603KB]
  - YutianArticle.exe.config[217B]
  - YutianArticle.exe.manifest[5KB]
  - YutianArticle.pdb[121KB]
- Release
BLL
- AccessHelper.cs[6KB]
- ContentBLL.cs[15KB]
- HtmlBLL.cs[25KB]
- Models.cs[1KB]
DLL
- HtmlAgilityPack.dll[131KB]
- Newtonsoft.Json.dll[528KB]
obj
- Debug
  - TempPE
    - Properties.Resources.Designer.cs.dll[3KB]
  - .NETFramework,Version=v4.6.2.AssemblyAttributes.cs[214B]
  - Article.application[1KB]
  - Article.csproj.AssemblyReference.cache[11B]
  - Article.csproj.CopyComplete[0B]
  - Article.csproj.CoreCompileInputs.cache[42B]
  - Article.csproj.FileListAbsolute.txt[1KB]
  - Article.csproj.GenerateResource.cache[1KB]
  - Article.exe[603KB]
  - Article.exe.manifest[5KB]
  - Article.pdb[123KB]
  - Article.Properties.Resources.resources[180B]
  - DesignTimeResolveAssemblyReferences.cache[701B]
  - DesignTimeResolveAssemblyReferencesInput.cache[7KB]
  - YutianArticle.application[1KB]
  - YutianArticle.csproj.AssemblyReference.cache[4KB]
  - YutianArticle.csproj.CopyComplete[0B]
  - YutianArticle.csproj.CoreCompileInputs.cache[42B]
  - YutianArticle.csproj.FileListAbsolute.txt[1KB]
  - YutianArticle.csproj.GenerateResource.cache[948B]
  - YutianArticle.exe[603KB]
  - YutianArticle.exe.manifest[5KB]
  - YutianArticle.pdb[121KB]
  - YutianArticle.Properties.Resources.resources[180B]
  - YutianSystem.MainForm.resources[91KB]
  - YutianSystem.NewsDetailForm.resources[90KB]
  - YutianSystem.NewsForm.resources[90KB]
  - YutianSystem.TaskForm.resources[90KB]
  - YutianSystem.WebForm.resources[90KB]
Properties
- AssemblyInfo.cs[1KB]
- Resources.Designer.cs[2KB]
- Resources.resx[5KB]
- Settings.Designer.cs[1KB]
- Settings.settings[249B]
Views
- MainForm.cs[11KB]
- MainForm.Designer.cs[15KB]
- MainForm.resx[140KB]
- NewsDetailForm.cs[757B]
- NewsDetailForm.Designer.cs[3KB]
- NewsDetailForm.resx[140KB]
- NewsForm.cs[2KB]
- NewsForm.Designer.cs[3KB]
- NewsForm.resx[140KB]
- TaskForm.cs[3KB]
- TaskForm.Designer.cs[20KB]
- TaskForm.resx[140KB]
- WebForm.cs[1KB]
- WebForm.Designer.cs[7KB]
- WebForm.resx[140KB]
截图
- Dingtalk_20220115170039.jpg[239KB]
- Dingtalk_20220115170055.jpg[63KB]
- Dingtalk_20220115170103.jpg[49KB]
- Dingtalk_20220115170117.jpg[205KB]
- Dingtalk_20220115170136.jpg[160KB]
- Dingtalk_20220115170239.jpg[280KB]
- Dingtalk_20220115170330.jpg[172KB]
- Dingtalk_20220115170528.jpg[717KB]
- Dingtalk_20220115170745.jpg[826KB]
- Dingtalk_20220119085613.jpg[30KB]
教程截图
- Dingtalk_20220117165954.jpg[202KB]
- Dingtalk_20220117170032.jpg[161KB]
- Dingtalk_20220117170046.jpg[196KB]
- Dingtalk_20220117170716.jpg[323KB]
- Dingtalk_20220117170834.jpg[307KB]
- Dingtalk_20220117170921.jpg[250KB]
- Dingtalk_20220117170943.jpg[252KB]
- Dingtalk_20220117171018.jpg[215KB]
- Dingtalk_20220117171042.jpg[216KB]
- Dingtalk_20220117171307.jpg[721KB]
- Dingtalk_20220117171404.jpg[215KB]
- Dingtalk_20220117171509.jpg[755KB]
- Dingtalk_20220117171554.jpg[309KB]
- Dingtalk_20220117171610.jpg[216KB]
- Dingtalk_20220117171658.jpg[362KB]
- Dingtalk_20220117171707.jpg[235KB]
- Dingtalk_20220117171802.jpg[47KB]
- Dingtalk_20220117171834.jpg[758KB]
51Aspx源码必读.txt[6KB]
App.config[217B]
FodyWeavers.xml[178B]
FodyWeavers.xsd[6KB]
packages.config[298B]
Program.cs[452B]
YutianArticle.csproj[10KB]
from .gif[4KB]
logo.ico[89KB]
Packages.dgml[1KB]
YutianArticle.csproj.user[627B]
YutianArticle.sln[1KB]
使用教程.docx[4.5MB]
最新Asp.Net源码下载.url[123B]

源码介绍

源码参数

源码类别：【网络应用】
源码类型：C/S
适合人群：菜鸟
授权类型：商业版
开发语言：C#
数据库：其他
源码大小：13.23MB
相关网址：【免费浏览】
源码指数： 
完整度： 

一、源码特点
1.通过C#语言.net winform框架实现的网络爬虫软件，网页大数据抓取工具。
2.是一款使用简单、功能强大的网络爬虫工具，完全可视化操作，无需编写代码，内置海量模板，支持任意网络数据抓取，连续五年大数据行业数据采集领域排名领先。
3.适合软件开发技术人员和做电子商务互联网企业做SEO和网络营销、网络推广、网站开发、网站运营、大数据处理等行业，适合想要学习winform 多线程网络技术的同学，适合销售、数据分析、政府机关、站长等。

二、项目详情
内部项目名：YutianArticle
产品名：雨田多线程爬虫采集软件SEO文章采集器
版本号：1.0
开发周期：4个月
开发时间：2015年-2022年
开发语言：C#
系统架构：C/S
软件类型：工具类
开发工具：Microsoft Visual Studio 2019
所用数据库：Access/json
开发系统： Windows 10
运行环境：Windows 2000/Windows Server 2003/Windows XP/Windows Server 2008/Windows Server 2012/Windows 7/Windows Vista/Windows 8||8.1/Windows 10

三、所用技术栈
1.HttpClient cookie网络请求技术。
2.Access数据库增删改查技术。
3.Winform ListView/ContextMenu控件，进度条控件。
4.数学和计算机编程结合。
5.HtmlAgilityPack网页html解析框架。
6.Costura.Fody发布为绿色版软件exe执行。
7.json序列化和反序列化技术。
8.大数据内容处理过滤算法。

四、产品功能点
1.智能采集文章，提供多种网页采集策略与配套资源，帮助整个采集过程实现数据的完整性与稳定性。
2.全网适用，眼见即可采，不管是文字图片，还是贴吧论坛，支持所有业务渠道的爬虫，满足各种采集需求。
3.内置了强大的数据格式化引擎，支持字符串替换、正则表达式替换或匹配、去除空格、添加前缀或后缀、日期时间格式化、HTML转码等多项功能，采集过程中全自动处理，无需人工干预，即可得到所需格式数据。
4.多线程，多任务模式，分布式云集群服务器和多用户协作管理平台的支撑，可灵活调度任务，顺利爬取海量数据。
5.通过简单的任务规则设置，便可实现自动化采集，全面覆盖多个行业，包括但不限于互联网，建筑，教育培训，医疗健康，科技，机械工程，电商，文化旅游，交通等行业。
6.清晰直观的界面和内容展现形式。

五、使用说明书
如何顺利采集一个网站的所有文章
可以先把config/urls文件夹下和config/urls2文件夹下的txt文本删除，任务删除。

步骤1：打开软件新建任务
步骤2：寻找行业网站-内容频道-翻页到第2页，复制url，再翻页到最后一页复制url
步骤3：输入列表页xpath代码
步骤4：输入内容页包含文章内容的div容器的xpath代码
步骤5：输入title截取字符串开始代码
步骤6：输入title截取字符串结束代码
步骤7：保存任务，刷新任务
步骤8：选择任务，点击采集url按钮，开始爬取内容页
步骤9：内容页爬取完成，刷新任务
步骤10：选择任务，点击开始任务按钮，下载所有内容页文章
步骤11：下载完成，查看下载后的文章
步骤12：关闭应用软件，点开根目录下的access数据库，文章已经完全采集完毕了

责任编辑：奋斗的阿蒙

下单记录

用户名	源码评分	成交价	下单时间	订单状态

源码评论

评论列表

全部评论

暂无评论 …