url es la variable con la url a scrapear //valga el palabro
"//td[@align='left']" es una expresión xpath que devolvería los TD con alineación izquierda
Para hacer el scrapping con cSharp usamos ScrapySharp
Hay ejemplo completo en GitHub aquí
Código:
ScrapingBrowser Browser = new ScrapingBrowser(); Browser.UserAgent = new FakeUserAgent("primero", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:27.0) Gecko/20100101 Firefox/27.0"); Browser.AllowAutoRedirect = true; // Browser has settings you can access in setup Browser.AllowMetaRedirect = true; WebPage PageResult = await Browser.NavigateToPageAsync(new Uri(url)); IEnumerableTDs = PageResult.Html.SelectNodes("//td[@align='left']"); this.lNombre.Clear(); foreach (HtmlNode item in TDs) { this.lContenidosTDs.Add(item.InnerText); }