C#根据特定URL网址获取网页源码(完整html代码)后用正则式匹配得到目标串

编程知识 更新时间:2023-04-07 13:40:31

由于第一次处理网页数据,很多东西不懂,希望各位大神指教!=.=

但是下面的代码在笔者机器上成功运行并得到目标结果,有需要的可以参考.


完整的html代码不贴了,只贴需要操作的html部分:

<ul>
XMin: 471693.638132605<br/>
YMin: 4232141.47862875<br/>
XMax: 505560.37253274<br/>
YMax: 4251694.22606757<br/>
Spatial Reference: 21481<br/>
</ul>

如上html所示,最后要得到的目标是提取这块代码中的数字串.如下

471693.638132605 4232141.47862875 505560.37253274 4251694.22606757


C#代码如下:

         string pageHtml;
	 string url = "";//输入url
            try
            {
                WebClient myWeb = new WebClient( );//WebClient()根据特定url获取文件
                myWeb.Credentials = CredentialCache.DefaultCredentials;//获取身份检测的凭证
                Byte [ ] pageData = myWeb.DownloadData( url );
                //string pageHtml = Encoding.Default.GetString( pageData );
                pageHtml = Encoding.UTF8.GetString( pageData );
<span style="white-space:pre">		</span>//下面是正则匹配过程
                string var = Regex.Match( pageHtml , @"XMin:\s\d{0,}.\d{0,}<br/>\nYMin:\s\d{0,}.\d{0,}<br/>\nXMax:\s\d{0,}.\d{0,}<br/>\nYMax:\s\d{0,}.\d{0,}<br/>\n" ).Value;
                var = Regex.Replace( var , @"XMin:\s" , "" );
                var = Regex.Replace( var , @"YMin:\s" , "" );
                var = Regex.Replace( var , @"XMax:\s" , "" );
                var = Regex.Replace( var , @"YMax:\s" , "" );
                var = Regex.Replace( var , @"<br/>" , "" );
                var = Regex.Replace( var , @"\s" , " " );
                Console.WriteLine( var );
                Console.ReadLine( );
            }
            catch( WebException webEx )
            {
                Console.WriteLine( webEx.Message.ToString( ) );
            }


            

执行上诉代码后得到的结果如下所示:

471693.638132605 4232141.47862875 505560.37253274 4251694.22606757


更多推荐

C#根据特定URL网址获取网页源码(完整html代码)后用正则式匹配得到目标串

本文发布于:2023-04-07 13:40:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/137e815aec719fe17b189080d7c47765.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:正则   源码   完整   目标   代码

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!

  • 53493文章数
  • 14阅读数
  • 0评论数