ASP.NET 爬取网页页面內容-文本

2021-02-20 08:28 admin
ASP.NET 爬取网页页面內容-文本ASP.NET 爬取网页页面內容-照片ASP.NET 爬取网页页面內容-Post 数据信息ASP.NET 爬取网页页面內容-避免跳转ASP.NET 爬取网页页面內容-维持登陆情况ASP.NET 爬取网页页面內容-把当今对话送到 WebRequest 中ASP.NET 爬取网页页面內容-怎样变更来源于 Referer 和 UserAgentASP.NET 爬取网页页面內容-用 WebClient 轻轻松松完成文档免费下载提交、网页页面爬取ASP.NET 爬取网页页面內容-WebBrowser 的 Navigated、DocumentCompleted 应用及差别

ASP.NET 中爬取网页页面內容是是非非常便捷的,而在其中也是处理了 ASP 中困惑大家的编号难题。

必须三个类:WebRequest、WebResponse、StreamReader。

WebRequest、WebResponse 的名字室内空间是:

System.Net

StreamReader 的名字室内空间是:

System.IO

关键编码

WebRequest request = WebRequest.Create("");
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); WebRequest 类的 Create 为静态数据方式,主要参数为要爬取的网页页面的网站地址; Encoding 特定编号,Encoding 中有特性 ASCII、UTF32、UTF8 等全世界通用性的编号,但沒有 gb2312 这一编号特性,因此大家应用 GetEncoding 得到 gb2312 编号。

实例

%@ Page Language="C#" %
%@ Import Namespace="System.Net" %
%@ Import Namespace="System.IO" %
!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "TR/xhtml1/DTD/xhtml1-transitional.dtd" script runat="server"
  void Page_Load(object sender, EventArgs e)
  {
  try
  {
  WebRequest request = WebRequest.Create("");
  WebResponse response = request.GetResponse();
  StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
 
  tb.Text = reader.ReadToEnd();
 
 reader.Close();
 reader.Dispose();
  response.Close();
  }
  catch (Exception ex)
  {
  tb.Text = ex.Message;
  }
  }
/script html xmlns="1999/xhtml"
head runat="server"
  title 爬取网页页面內容 - 千一互联网 /title
/head
body
  form id="form1" runat="server"
  div
  asp:TextBox ID="tb" runat="server" Width="500" Height="300" TextMode="multiLine" /asp:TextBox
  /div
  /form
/body
/html

有关阅读文章

怎样用 Encoding 特定编号 在ASP.NET 中推送电子邮件(带SMTP 认证、带配件) ASP “窃贼”程序 WebRequest 推送 Cookie、Referer 用 WebClient 轻轻松松完成文档免费下载提交、网页页面爬取 ASP.NET 爬取网页页面內容-文本ASP.NET 爬取网页页面內容-照片ASP.NET 爬取网页页面內容-Post 数据信息ASP.NET 爬取网页页面內容-避免跳转ASP.NET 爬取网页页面內容-维持登陆情况ASP.NET 爬取网页页面內容-把当今对话送到 WebRequest 中ASP.NET 爬取网页页面內容-怎样变更来源于 Referer 和 UserAgentASP.NET 爬取网页页面內容-用 WebClient 轻轻松松完成文档免费下载提交、网页页面爬取ASP.NET 爬取网页页面內容-WebBrowser 的 Navigated、DocumentCompleted 应用及差别