Discussion:
[pyar] Extraer datos de Google flights
Emanuel Benatti
2016-05-15 11:45:50 UTC
Permalink
Hola gentes,
tengo la siguiente situación: quiero hacer un programa que a partir de
ciertos datos de entrada me extraiga de la google flights[1] los datos del
mejor vuelo disponible (en precio) y me lo ponga en un archivo de texto. La
idea luego es automatizar la implementación de este programa para poder
luego estudiar cómo varía el precio a lo largo del tiempo para un
determinado vuelo.
Los parámetros de entrada serían origen, destino y fecha, aunque en esta
primera aproximación al problema lo único que quiero es poder sacar el
precio del mejor vuelo para un caso particular, e.g., Buenos
Aires-Barcelona el 13 de agosto (sólo ida).

Tengo alguna experiencia programando en python, pero sólo en aplicaciones
científicas (métodos numéricos, procesamiento de datos, etc), pero tengo no
sé nada de cómo se trabaja con páginas web y de HTML. Estuve buscando algo
de material en la web, y encontré algunos ejemplos piolas, pero cuando los
aplico a mi caso particular no andan :S

Entonces las preguntas son:
1. ¿Existe ya algún código que resuelva lo que yo quiero hacer?
2. ¿Hay algún lugar con código de ejemplo que pueda utilizar para resolver
este problema?
3. ¿Alguien ha trabajado con este problema antes?
4. ¿Cómo lo solucionaron?
5. ¿Qué buen material hay (inglés o español) para aprender hacer web
scrapping en python?

Saludos y muchas gracias


[1] https://www.google.de/flights/
--
Emanuel Benatti
milos zorica
2016-05-15 13:09:23 UTC
Permalink
hice algo parecido con despegar.com

parece que hay una API para google flights
https://developers.google.com/qpx-express/
Gustavo Orrillo
2016-05-17 16:42:55 UTC
Permalink
yo iria por el servicio que brinda Google o por Selenium. Ahora... trabaje
con ese problema durante dos años, y por experiencia te digo que si ves un
precio que te sirva, compralo. No hagas el super analisis ni especules.
Porque del otro lado las aerolineas saben mucho mas sobre la demanda de los
vuelos que vos, y son mas rapidas implementando cambios de precios.

Mi otro consejo es, si buscas un pasaje barato. Tomate el Buquebus hasta
Montevideo y vola desde Uruguay. Minimo te ahorras unos 100 euros.
Si se trata de extraer datos de páginas web sería mediante webscraping ,
para eso q usando selenium si vas a hacerlo con interacción con las páginas
web o sino si es sobre una página web específica q no necesites navegar por
los enlaces puede ser urllib
hice algo parecido con despegar.com
parece que hay una API para google flights
https://developers.google.com/qpx-express/
_______________________________________________
http://listas.python.org.ar/listinfo/pyar
PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
_______________________________________________
http://listas.python.org.ar/listinfo/pyar
PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Ariel Camino
2016-05-17 19:44:08 UTC
Permalink
Post by Emanuel Benatti
Hola gentes,
tengo la siguiente situación: quiero hacer un programa que a partir de
ciertos datos de entrada me extraiga de la google flights[1] los datos
del mejor vuelo disponible (en precio) y me lo ponga en un archivo de
texto. La idea luego es automatizar la implementación de este programa
Hola Emanuel, yo quise hacer lo mismo hace unos meses.

Podes usar la API de google flights para eso, el problema es que es
carísima:

https://developers.google.com/qpx-express/v1/pricing

Sí no leiste mal:

1 query: $0.035 US

Imaginate que si querés hacer todas las combinaciones posibles entre 2
rangos de fechas, estás hablando de bastante plata, te sale más barato
ir y pagar un pasaje más caro :P

Ni hablar si estás pensando hacer un trayecto multitramo tipo:

Buenos Aires - Puerto Iguazú
Foz de iguazú - Barcelona
Barcelona - Buenos Aires

Y el otro tema es olvidate de scrapear datos de google sin usar sus
APIs, tenes que usar algo tipo:

http://luminati.io/

que arranca en 500 USD por mes.

Suerte!
--
Ariel Camino
_______________________________________________
pyar mailing list ***@python.org.ar
http://listas.python.org.ar/listinfo/pyar

PyAr - Python Argentina - Sitio web: http://www.python.org.ar/

La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argentina -
Marcos Dione
2016-05-17 20:10:10 UTC
Permalink
Post by Gustavo Orrillo
yo iria por el servicio que brinda Google o por Selenium. Ahora... trabaje
con ese problema durante dos años, y por experiencia te digo que si ves un
precio que te sirva, compralo. No hagas el super analisis ni especules.
Porque del otro lado las aerolineas saben mucho mas sobre la demanda de los
vuelos que vos, y son mas rapidas implementando cambios de precios.
yo laburé en Amadeus[1] 3 años y te puedo confirmar que el precio de
un pasaje no tiene nada que ver ni con el costo ni con la demanda ni con
la oferta, y que como dice Gustavo, tiene una volatilidad muy alta. si te
vas a poner a trackear precios de vuelos, no te quedes con el más barato.
y de todas formas es ilegal/sale plata scrappear la mayoría de los
buscadores de vuelos.

--
[1] https://en.wikipedia.org/wiki/Amadeus
--
(Not so) Random fortune:
19:39 < m4rgin4l> por chupamedias
19:40 < m4rgin4l> o como me gusta denominarlo: academic social
engineering
_______________________________________________
pyar mailing list ***@python.org.ar
http://listas.python.org.ar/listinfo/pyar

PyAr - Python Argentina - Sitio web: http://www.python.org.ar/

La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argentina - http://www.usla.or
Marcos Dione
2016-05-17 20:11:02 UTC
Permalink
Post by Marcos Dione
[1] https://en.wikipedia.org/wiki/Amadeus
juaz, quise decir este otro:

https://en.wikipedia.org/wiki/Amadeus_IT_Group
_______________________________________________
pyar mailing list ***@python.org.ar
http://listas.python.org.ar/listinfo/pyar

PyAr - Python Argentina - Sitio web: http://www.python.org.ar/

La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argen
Loading...