url es la variable con la url a scrapear //valga el palabro
"//td[@align='left']" es una expresión xpath que devolvería los TD con alineación izquierda
Para hacer el scrapping con cSharp usamos ScrapySharp
Hay ejemplo completo en GitHub aquí
Código:
ScrapingBrowser Browser = new ScrapingBrowser();
Browser.UserAgent = new FakeUserAgent("primero", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:27.0) Gecko/20100101 Firefox/27.0");
Browser.AllowAutoRedirect = true; // Browser has settings you can access in setup
Browser.AllowMetaRedirect = true;
WebPage PageResult = await Browser.NavigateToPageAsync(new Uri(url));
IEnumerable TDs = PageResult.Html.SelectNodes("//td[@align='left']");
this.lNombre.Clear();
foreach (HtmlNode item in TDs) {
this.lContenidosTDs.Add(item.InnerText);
}
