首页 .Net .Net(C#) Core安装使用AngleSharp解析html的方法及示例代码

.Net(C#) Core安装使用AngleSharp解析html的方法及示例代码

1、通过NuGet获取AngleSharp

1)使用Nuget管理控制台

将AngleSharp集成到项目中的最简单方法是使用NuGet。您可以通过打开包管理器控制台(PM)并键入以下语句来安装AngleSharp:

Install-Package AngleSharp

2)使用Nuget图形管理器

使用Nuget的界面的管理器搜索"AngleSharp"=> 找到点出点击"安装"。

相关文档VS(Visual Studio)中Nuget的使用

2、使用AngleSharp解析html的示例

var source = @"
<!DOCTYPE html>
<html lang=en>
  <meta charset=utf-8>
  <meta name=viewport content=""initial-scale=1, minimum-scale=1, >
  <title>Error 404 (Not Found)!!1</title>
  <>//使用给定的配置创建用于评估web页面的新上下文
var context = BrowsingContext.New(config);
//只需要获得DOM表示
var document = await context.OpenAsync(req => req.Content(source));
//将其序列化回控制台
Console.WriteLine(document.DocumentElement.OuterHtml);

3、简单操作document(Dom文档)

static async Task FirstExample()
{
    //使用AngleSharp的默认配置
    var config = Configuration.Default;
    //使用给定的配置创建用于评估web页面的新上下文
    var context = BrowsingContext.New(config);
    //从响应的内容解析文档到虚拟请求
    var document = await context.OpenAsync(req => req.Content("<h1>Some example source</h1><p>This is a paragraph element"));
    //对文档执行如下操作
    Console.WriteLine("Serializing the (original) document:");
    Console.WriteLine(document.DocumentElement.OuterHtml);
    var p = document.CreateElement("p");
    p.TextContent = "This is another paragraph.";
    Console.WriteLine("Inserting another element in the body ...");
    document.Body.AppendChild(p);
    Console.WriteLine("Serializing the document again:");
    Console.WriteLine(document.DocumentElement.OuterHtml);
}

4、获取html中的元素

static async Task UsingLinq()
{
    //使用默认配置创建一个用于评估web页面的新上下文
    var context = BrowsingContext.New(Configuration.Default);
    //根据虚拟请求/响应模式创建文档
    var document = await context.OpenAsync(req => req.Content("<ul><li>First item<li>Second item<li >Third item!<li >Last item!</ul>"));
    //对LINQ做点什么
    var blueListItemsLinq = document.All.Where(m => m.LocalName == "li" && m.ClassList.Contains("blue"));
    //或者直接使用CSS选择器
    var blueListItemsCssSelector = document.QuerySelectorAll("li.blue");
    Console.WriteLine("Comparing both ways ...");
    Console.WriteLine();
    Console.WriteLine("LINQ:");
    foreach (var item in blueListItemsLinq)
    {
        Console.WriteLine(item.Text());
    }
    Console.WriteLine();
    Console.WriteLine("CSS:");
    foreach (var item in blueListItemsCssSelector)
    {
        Console.WriteLine(item.Text());
    }
}
static async Task SingleElements()
{
    //使用默认配置创建一个用于评估web页面的新上下文
    var context = BrowsingContext.New(Configuration.Default);
    //创建一个新文档
    var document = await context.OpenAsync(req => req.Content("<b><i>This is some <em> bold <u>and</u> italic </em> text!</i></b>"));
    var emphasize = document.QuerySelector("em");
    Console.WriteLine("Difference between several ways of getting text:");
    Console.WriteLine();
    Console.WriteLine("Only from C# / AngleSharp:");
    Console.WriteLine();
    Console.WriteLine(emphasize.ToHtml());   //<em> bold <u>and</u> italic </em>
    Console.WriteLine(emphasize.Text());   // bold and italic
    Console.WriteLine();
    Console.WriteLine("From the DOM:");
    Console.WriteLine();
    Console.WriteLine(emphasize.InnerHtml);  // bold <u>and</u> italic
    Console.WriteLine(emphasize.OuterHtml);  //<em> bold <u>and</u> italic </em>
    Console.WriteLine(emphasize.TextContent);// bold and italic
}

参考文档https://anglesharp.github.io/docs/Examples.html

特别声明:本站部分内容收集于互联网是出于更直观传递信息的目的。该内容版权归原作者所有,并不代表本站赞同其观点和对其真实性负责。如该内容涉及任何第三方合法权利,请及时与824310991@qq.com联系,我们会及时反馈并处理完毕。