后台-插件-广告管理-内容页广告位一(手机)

您现在的位置是:首页 > 开发类 > 问答问答

可能是关于判断下载数据的类型的问题

2021-07-06 20:45:53问答人已围观

简介 我在做一个爬虫,用来爬网页,并不是爬电影的文件,可是爬虫在爬链接进会把http://www.sina.com/a.wmv加入进去,这种明文的我们当然是可以处理掉的,但是暗文的,如

我在做一个爬虫,用来爬网页,并不是爬电影的文件,可是爬虫在爬链接进会把http://www.sina.com/a.wmv加入进去,这种明文的我们当然是可以处理掉的,但是暗文的,如http://www.sina.com/video?id=1我们是没有办法的只有在下载这个页面时才能处理,我的问题是如何判定这个页面是一种媒体文件,或者说当文件大于10M时,我们就可忽略这个文件的采集

最佳答案:

判断数据类型并不困难,只要判断 Response 的Headers就可以得到数据的类型

方法如下

 

        HttpWebRequest _MyRequest = null;
        HttpWebResponse _MyResponse = null;

中间的过程我省略的,太多地方有描述了,我想楼主也一定很清楚了,就直接切入正题了。

 

            _MyResponse = (HttpWebResponse)_MyRequest.GetResponse();

            WebHeaderCollection _ResponseHeaders = _MyResponse.Headers;

 

    string _ContentType = _ResponseHeaders["Content-Type"];

 

    这里的 _ContentType 就是数据的类型,一般.wmv 应该是stream具体的楼主测试一下就可以了。另外通过

_ResponseHeaders["Content-Length"]; 还可以得到数据的大小

 

 

文章来源:https://q.cnblogs.com/q/2773/

Tags:.net技术 c 

很赞哦! ()

后台-插件-广告管理-内容页广告位二(手机)

相关文章

后台-插件-广告管理-内容页广告位三(手机)
后台-插件-广告管理-内容页广告位四(手机)

文章评论

留言与评论(共有 0 条评论)
   
验证码:

本栏推荐

站点信息

  • 文章统计90335篇文章
  • 浏览统计10088次浏览
  • 评论统计1个评论
  • 标签管理标签云
  • 统计数据:统计代码
  • 微信公众号:扫描二维码,关注我们