返回

首页

业界

电商

创业

访谈

手机

移动

报告

运营

建站

互联网+

系统

教程

易采站长站-移动端

c#爬虫爬取京东的商品信息

2020-01-05 09:57:08王旭

获取所有商品的信息分为两个步骤

（1）根据商品分类页面获取所有商品分类的URL

（2）根据商品分类URL获取每个商品

1、获取商品分类


try
{
 string html = HttpHelper.DownloadUrl(@"http://www.easck.com/allSort.aspx");
 HtmlDocument doc = new HtmlDocument();
 doc.LoadHtml(html);
 string goodClass= @"//*[@class='items']/dl/dd";
 HtmlNodeCollection noneNodeList = doc.DocumentNode.SelectNodes(goodClass);
 foreach (var node in noneNodeList)
 {
 HtmlDocument docChild = new HtmlDocument();
 docChild.LoadHtml(node.OuterHtml);
 string urlPath = "/dd/a";
 HtmlNodeCollection list = docChild.DocumentNode.SelectNodes(urlPath);
 foreach (var l in list)
 {
  HtmlDocument docChild1 = new HtmlDocument();
  docChild1.LoadHtml(l.OuterHtml);
  var sortUrl = l.Attributes["href"].Value;
  if (!string.IsNullOrWhiteSpace(sortUrl) && sortUrl.Contains("cat="))
  {
  InsertSort("https:" + sortUrl);
  }
 }
 }
}
catch (Exception ex)
{
 Console.WriteLine(ex.Message);
}




	上面的代码中使用到了HtmlAgilityPack来解析HTML信息，这是.NET的开源项目，开源在nuget包中下载。

	      （1）下载http://www.easck.com/allSort.aspx的html页，然后加载到HtmlDocument

	      （2）选择节点，获取每个大类的节点集合

	      （3）根据每个大类的节点，获取每个小类的节点信息，然后获取到分类地址

	节点中也包含了其它很多信息，可以根据自己的需求去获取对应的信息								 
 2/4   首页 上一页 1 2 3 4 下一页 尾页


		
				
    相关文章
    大家在看


    
			



C#实现获取文件大小并进行比较
2023-03-15
0万阅读





利用C#编写一个Windows服务程序的方法详解
2023-03-14
0万阅读





C#实现日期时间的格式化输出的示例详解
2023-03-13
0万阅读





C#递归应用之实现JS文件的自动引用
2023-03-13
0万阅读





C#递归应用之实现JS文件的自动引用
2023-03-11
0万阅读





C#异步编程之async/await详解
2023-03-11
0万阅读





C#/VB.NET实现在Word中插入或删除脚注
2023-03-08
0万阅读





WPF利用ValueConverter实现值转换器
2023-03-08
0万阅读





C#/VB.NET实现在Word文档中添加页眉和页脚
2023-03-07
0万阅读





c#中如何获取指定字符前的字符串
2023-03-03
0万阅读


			
		
	  
    
	
	


C#实现获取文件大小并进行比较
2023-03-15
0万阅读





利用C#编写一个Windows服务程序的方法详解
2023-03-14
0万阅读





C#实现日期时间的格式化输出的示例详解
2023-03-13
0万阅读





C#递归应用之实现JS文件的自动引用
2023-03-13
0万阅读





C#递归应用之实现JS文件的自动引用
2023-03-11
0万阅读





C#异步编程之async/await详解
2023-03-11
0万阅读





C#/VB.NET实现在Word中插入或删除脚注
2023-03-08
0万阅读





WPF利用ValueConverter实现值转换器
2023-03-08
0万阅读





C#/VB.NET实现在Word文档中添加页眉和页脚
2023-03-07
0万阅读





c#中如何获取指定字符前的字符串
2023-03-03
0万阅读


	
    

        
电脑版 - 移动首页