【例子介绍】c# .net 网络爬虫 网页提取
手写网络爬虫 能抓取网页 广度优先 可设置深度 vs2008测试 能进行网页提取 内容提取 标题提取 meta提取 server数据入库 欢迎参考 有好的建议请发送邮件blackjunes@sina.com
【相关图片】
【源码结构】
文件清单
└── SearchSpider
├── ConsoleApplication1
│ ├── ConsoleApplication1
│ │ ├── bin
│ │ │ └── Debug
│ │ │ ├── ConsoleApplication1.exe
│ │ │ ├── ConsoleApplication1.pdb
│ │ │ ├── ConsoleApplication1.vshost.exe
│ │ │ └── ConsoleApplication1.vshost.exe.manifest
│ │ ├── Class1.cs
│ │ ├── ConsoleApplication1.csproj
│ │ ├── obj
│ │ │ └── Debug
│ │ │ ├── ConsoleApplication1.csproj.FileListAbsolute.txt
│ │ │ ├── ConsoleApplication1.exe
│ │ │ ├── ConsoleApplication1.pdb
│ │ │ └── TempPE
│ │ ├── Program.cs
│ │ └── Properties
│ │ └── AssemblyInfo.cs
│ ├── ConsoleApplication1.sln
│ └── ConsoleApplication1.suo
└── SearchSpider
├── SearchSpider
│ ├── analyze.cs
│ ├── analyze_Html.cs
│ ├── bin
│ │ └── Debug
│ │ ├── SearchSpider.exe
│ │ ├── SearchSpider.pdb
│ │ ├── SearchSpider.vshost.exe
│ │ └── SearchSpider.vshost.exe.manifest
│ ├── ISpider.cs
│ ├── myfile.txt
│ ├── obj
│ │ └── Debug
│ │ ├── SearchSpider.csproj.FileListAbsolute.txt
│ │ ├── SearchSpider.exe
│ │ ├── SearchSpider.pdb
│ │ └── TempPE
│ ├── Program.cs
│ ├── Properties
│ │ └── AssemblyInfo.cs
│ ├── rooturl.cs
│ ├── SearchSpider.csproj
│ ├── Spider.cs
│ ├── store.cs
│ └── Url.cs
├── SearchSpider.sln
└── SearchSpider.suo
17 directories, 33 files
评论