抓取的html和源代码不一样,抓取其他页面的HTML，非源码

后台代码如下：string url = "http://baoliao.cq.qq.com/pc/detail.html?id=443758s";HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);request.Accept = "*/*"; //接受任意文件request.UserAgent = "Mozilla/4.

weixin_39828859

287人浏览 · 2021-05-31 07:52:55

weixin_39828859 · 2021-05-31 07:52:55 发布

后台代码如下：

string url = "http://baoliao.cq.qq.com/pc/detail.html?id=443758s";

HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);

request.Accept = "*/*"; //接受任意文件

request.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.1.4322)"; //

request.AllowAutoRedirect = true;//是否允许302

request.Referer = url; //当前页面的引用

HttpWebResponse response = (HttpWebResponse)request.GetResponse();

Stream stream = response.GetResponseStream();

StreamReader reader = new StreamReader(stream, Encoding.GetEncoding("utf-8"));

html = reader.ReadToEnd();

stream.Close();

text.Text = html;

如题，asp.net 抓取页面内容，如http://baoliao.cq.qq.com/pc/detail.html?id=443758这个网站的内容，其他页面的抓取都没问题，这个网站好像有点特殊，他只能抓取到页面的源代码，但不能抓取到整个HTML，各位大神也可以打开这网站的源码，也找不到内容主体。但HTML有内容主体，求解，怎么抓取到内容主体。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从一次 Spring Boot + MySQL 报错，看 Web 攻击面与防御模型，用安全视角复盘攻击面、风险点与防御机制的记录。

2048 AI社区

法律AI智能体在婚姻家事法律咨询中的特殊处理

我是林深，一位专注于法律AI的软件工程师，曾在某头部法律科技公司负责婚姻家事AI产品的研发。我相信“法律不是冰冷的规则，而是保护人的工具”，希望通过技术让更多人能触达法律的温暖。如果你有婚姻家事法律问题，或者对法律AI感兴趣，欢迎在评论区留言，我会一一回复。行动号召：如果你或你身边的人正在经历婚姻家事纠纷，不妨试试我们的法律AI（附上链接）——它可能不是“完美的”，但一定是“懂你的”。也欢迎你在评

2048 AI社区

DataWhale Hello-Agents 初识智能体：大语言模型与工具调用的完美结合

知识截止:训练数据有时间边界,无法获取实时信息无法行动:只能生成文本,无法与外部世界交互幻觉问题:可能编造不存在的事实在国内，为了保证查询的有效性，可以选择国内的天气查询API来构建工具# 将函数包装为LangChain工具# StructedTool.from_function可将一个函数直接转化为一个Langchain的工具类description="根据天气和城市,查询数个推荐的景点"# 使