7
WEB SCRAPING WITH C# Erick Wendel Gomes da Silva Software Developer

Mini Curso - WebScraping com C# - Erick Wendel

Embed Size (px)

Citation preview

WEB SCRAPING WITH C#

Erick Wendel Gomes da SilvaSoftware Developer

O QUE É WEB SCRAPING ?

SÓ OS HACKERZÃO !!!!111

DE ACORDO COM O WIKIPEDIA:É UMA TÉCNICA DE EXTRAÇÃO DE INFORMAÇÕES DE SITES A PARTIR DE UM SOFTWARE DE COMPUTADOR.

COMO FUNCIONA ?O SOFTWARE SE PASSA POR UM USUÁRIO COMUM, PARA OBTER INFORMAÇÕES MALICIOSAS (OU NÃO) DE FORMA AUTOMATIZADA.

ANTES DE COMEÇAR, ALGUMAS VERDADES !!!

WEB SCRAPING É ILEGAL ?DESDE QUE AS INFORMAÇÕES SEJAM PÚBLICAS, É TOTALMENTE LEGAL !!

NÃO É EXCLUSIVO DA PLATAFORMA .NETÉ UMA TÉCNICA ANTIGA, UTILIZADA POR DIVERSAS TECNOLOGIAS.

UMA TÉCNICA DE EXTRAÇÃO DE DADOS, MUITO CUIDADO!

DIFICULDADES

Dificilmente um site contém exatamente a mesma estrutura em tudo (listas, tabelas, etc). Boa parte das vezes, precisamos de validações para tratar excessões que possam ocorrer no caminho.

Dificilmente um site contém exatamente a mesma estrutura em tudo (listas, tabelas, etc). Boa parte das vezes, precisamos de validações para tratar excessões que possam ocorrer no caminho.

22

O desenvolvimento é realizado seguindo como base uma (ou várias) páginas HTML, caso a estrutura do site mudar, você precisará refazer todo o trabalho.

O desenvolvimento é realizado seguindo como base uma (ou várias) páginas HTML, caso a estrutura do site mudar, você precisará refazer todo o trabalho.

11

E CHEGA DE FALAR !!11

REFERENCIAS

WEB SITE (NADA DE WEB SCRAPING NELE EM !!)http://erickwendel.com.br

CODIGO FONTEhttp://bit.ly/WebScraping-Erick

HTML AGILITY PACKhttps://htmlagilitypack.codeplex.com/

LINKEDINhttp://linkedin.com/in/erickwendel

[email protected]

13/06/2015.

FIM !!111