20
1 Google Hacking María Isabel Rojo Rivas Madrid, Enero de 2014

Google hacking - Ponencia Gr2Dest

  • Upload
    mirojo

  • View
    3.305

  • Download
    9

Embed Size (px)

DESCRIPTION

Diapositivas de la ponencia sobre Google Hacking

Citation preview

Page 1: Google hacking - Ponencia Gr2Dest

1

Google Hacking

María Isabel Rojo RivasMadrid, Enero de 2014

Page 2: Google hacking - Ponencia Gr2Dest

CONTENIDOS

Un poco de historia Cómo indexan los buscadores User-Agent de buscadores Los archivos robots.txt ¿Qué es Google Hacking? La caché Google Hacking + Robots.txt Grode Más sobre Google Hacking Otros sitios de interés

2

Page 3: Google hacking - Ponencia Gr2Dest

UN POCO DE HISTORIA

1995 – Altavista: Crearon un software llamado «spider» o «crawler». Primeros en implementar multi idioma gracias al traductor Babel Fish.

1995 – Yahoo!: Es un directorio Web no motor de búsquedas.

1997 – Google: Introduce el concepto «PageRank» convirtiendole en líder del sector.

2000 – Yahoo y Google llegan aun acuerdo por el que el primero adopta el motor del búsquedas de Google.

2009 – Bing: Microsoft entra en el mercado de buscadores con el buscador cuya finalidad es ser fácil e intuitivo.

3

Page 4: Google hacking - Ponencia Gr2Dest

CÓMO INDEXAN LOS BUSCADORES

Inspeccionan la red a través de susarañas, web crawlers, robots o rastreadores.

4

Page 5: Google hacking - Ponencia Gr2Dest

USER AGENT DE BUSCADORESBuscador

Robot User-Agent

Google GoogleBot Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Bing BingBot Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bot.html)

Yahoo Slurp Mozilla/5.0 (compatible; Yahoo! Slurp; +http://help.yahoo.com/help/us/ysearch/slurp)

http://www.user-agents.org/

http://whatsmyuseragent.com/

5

Page 6: Google hacking - Ponencia Gr2Dest

PROBLEMÁTICA

¿Cómo parar a las arañas?

¿Cómo indicamos que archivos indexar y cuales no?

¿Seguro que no supone un problema que visite y descargue toda tu web?

6

Page 7: Google hacking - Ponencia Gr2Dest

LOS ARCHIVOS ROBOTS.TXT

Siguen un estándar.

Indican que directorios oarchivos no pueden las arañas visitar.

Listan donde esta el Sitemap

Archivos muy sencillos

7

Page 8: Google hacking - Ponencia Gr2Dest

LOS ARCHIVOS ROBOTS.TXTUser-agent: * Disallow: Sitemap: http://www.pepeweb.es/sitemap.xml

Todo accesible para los crawlers

User-agent: * Disallow: /Sitemap: http://www.pepeweb.es/sitemap.xml

Todo prohibido para los crawlers

8

Page 9: Google hacking - Ponencia Gr2Dest

LOS ARCHIVOS ROBOTS.TXTUser-agent: * Disallow: Disallow: /_*/ Disallow: /ES/FamiliaReal/Urdangarin/ Disallow: /CA/FamiliaReal/Urdangarin/ Disallow: /EU/FamiliaReal/Urdangarin/ Disallow: /GL/FamiliaReal/Urdangarin/ Disallow: /VA/FamiliaReal/Urdangarin/ Disallow: /EN/FamiliaReal/Urdangarin/Sitemap: http://www.casareal.es/sitemap.xml

http://www.casareal.es/robots.txt

9

Page 10: Google hacking - Ponencia Gr2Dest

LOS ARCHIVOS ROBOTS.TXTUser-agent: * Disallow:/?SGAE=LADRONES=MONOPOLIO Disallow:/?ladrones Disallow:/?mafiosos Disallow:/sg0-no-tocar/ Disallow:/sg1-no-tocar/ Disallow:/search/search-es.jsp?texto=<a href="">ladrones</a> Disallow:/search/search-es.jsp?texto=%3Cscript%3Ealert(%22efectivamente,%20somos%20unos%20ladrones%22);%3C/script%3E Disallow:/search/search-es.jsp?texto=%3Ch1%3ESomos%20unos%20ladrones%20salgamos%20primeros%20en%20google%20o%20no%3C/h1%3E Disallow:/search/search-es.jsp?texto=%3Ca%20href=%22%22%3Eladrones%3C/a%3E

http://www.sgae.es/robots.txt

10

Page 11: Google hacking - Ponencia Gr2Dest

LOS ARCHIVOS ROBOTS.TXT

Otros ejemplos:

http://www.fuerteventura2000.com/robots.txt

http://www.senado.es/robots.txt

http://google.es/robots.txt

inurl:robots.txt ext:txt

11

Page 12: Google hacking - Ponencia Gr2Dest

Realizar búsquedas que permiten detectar fugas de información y vulnerabilidades en los sistemas informáticos.

Fuente: http://www.netmarketshare.com/ 12

PCs y portátiles Smartphones y tablets

¿QUÉ ES GOOGLE HACKING?

Page 13: Google hacking - Ponencia Gr2Dest

GOOGLE HACKING Operadores básicos

• "Prueba" búsqueda textual.• "-Prueba" exclusión.• "+Prueba " inclusión.• OR operador booleano or.• "Prueba *" comodín

13

Page 14: Google hacking - Ponencia Gr2Dest

GOOGLE HACKING Comandos• Site: buscamos todo referente a un dominio.• Intitle: Buscamos un término en los títulos de las

webs• Intext: Buscamos un término en el cuerpo del

documento.• Inurl: Busca un término en la cadena URL• ext: Búsqueda según el tipo de documento

https://support.google.com/websearch/answer/136861?p=adv_operators&hl=e

14

Page 15: Google hacking - Ponencia Gr2Dest

GOOGLE HACKING Ejemplos de uso inurl:robots.txt ext:txt intitle:"Index of" config.php filetype:xls username password email inurl:axis-cgi/jpg inurl:/view.shtml site:pastebin.com intext:username password

http://www.exploit-db.com/google-dorks/

15

Page 16: Google hacking - Ponencia Gr2Dest

LA CACHÉ Copia de las webs que GoogleBot va visitando y

que se almacena en los servidores de Google, mantiene la copia guardada hasta que GoogleBot vuelve a visitar dicha web.

No almacena imágenes, solo el texto.

cache:miwebvictima.es16

Page 17: Google hacking - Ponencia Gr2Dest

GOOGLE HACKING + ROBOTS.TXT

17

Ejemplos de uso: http://

www.elladodelmal.com/2013/12/lo-que-se-comparte-por-dropbox-al.html

http://

www.elladodelmal.com/2013/10/79400-urls-de-gmail-indexadas-en-google.ht

ml

http://www.elladodelmal.com/2013/09/facebook-tiene-problemas-con-la.html

http://

www.elladodelmal.com/2013/09/problemas-de-privacidad-de-whatsapp-con.ht

ml

http://

www.elladodelmal.com/2013/11/busqueda-de-duenos-de-numeros-de.html

http://www.elladodelmal.com/2013/11/hacking-con-buscadores-en-los.html

Charla del autor de Hacking con buscadores.

Page 18: Google hacking - Ponencia Gr2Dest

GRODE.ES

18

Page 19: Google hacking - Ponencia Gr2Dest

MÁS SOBRE GOOGLE HACKING http://

0xword.com/es/libros/20-libro-hacking-buscadores-google-bing-sodan-robtex.html

Google Hacking for Penetration Testers vol.2

19