Discussion:
[pyar] Caracteres especiales con request.
Diego Carabajal
2018-09-24 12:19:46 UTC
Permalink
Estimados, buen día!

Los consulto, por que estoy usando una aplicación en python 2.7 que hace un
get a una api, para levantar datos de una base de datos en mysql.

Mi consulta reside, debido a que los datos almacenados en la bd no poseen
ningún carácter especial, pero cuando hago un request.get los datos que
vuelven poseen caracteres especiales. Por ejemplo:
[{"index":0,"Categoria":"PROVINCIA","Contenido":"El debate pol*\u00*edtico
por el Presupuesto Nacional 2019 volvi*\u00f3* a confirmar* \u2013*por

Es por ello, que les pregunto si están en conocimiento de como debería
hacer para evitar que retornen caracteres especiales al momento de hacer el
request.get().

Desde ya, muchas gracias!

Diego.
Cristian Cabrera
2018-09-24 16:42:41 UTC
Permalink
Buenas,

Me suena que es un tema de encoding. Te recomiendo que veas la charla de
Facundo Batista (uno de los miembros de la lista) sobre unicode [0].

[0]


Saludos!
Diego Carabajal
2018-09-25 12:20:09 UTC
Permalink
Hola Cristian,

Muchas gracias por el video. Acabo de verlo. Esta muy claro.

Saludos!

Diego.

El lun., 24 sept. 2018 a las 13:43, Cristian Cabrera (<
Post by Cristian Cabrera
Buenas,
Me suena que es un tema de encoding. Te recomiendo que veas la charla de
Facundo Batista (uno de los miembros de la lista) sobre unicode [0].
[0] http://youtu.be/Dr1R4ZlVLxI
Saludos!
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Leandro Poli
2018-09-24 18:09:52 UTC
Permalink
Hola

Probá esto:

r = requests.get(URL)

print(r.text)

Saludos
Post by Diego Carabajal
Estimados, buen día!
Los consulto, por que estoy usando una aplicación en python 2.7 que
hace un get a una api, para levantar datos de una base de datos en mysql.
Mi consulta reside, debido a que los datos almacenados en la bd no
poseen ningún carácter especial, pero cuando hago un request.get los
[{"index":0,"Categoria":"PROVINCIA","Contenido":"El debate
pol*\u00*edtico por el Presupuesto Nacional 2019 volvi*\u00f3* a
confirmar*\u2013*por
Es por ello, que les pregunto si están en conocimiento de como debería
hacer para evitar que retornen caracteres especiales al momento de
hacer el request.get().
Desde ya, muchas gracias!
Diego.
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argentina - http://www.usla.org.ar
Diego Carabajal
2018-09-25 12:21:02 UTC
Permalink
Hola Leandro,

Si ejecuto, lo que me indicas me sigue trayendo lo mismo. Por ej:
[{"index":0,"Categoria":"PROVINCIA","Contenido":"El debate pol*\u00*edtico
por el Presupuesto Nacional 2019 volvi*\u00f3*a confirmar* \u2013*por

Saludos!

Diego.
Post by Leandro Poli
Hola
r = requests.get(URL)
print(r.text)
Saludos
Estimados, buen día!
Los consulto, por que estoy usando una aplicación en python 2.7 que hace
un get a una api, para levantar datos de una base de datos en mysql.
Mi consulta reside, debido a que los datos almacenados en la bd no poseen
ningún carácter especial, pero cuando hago un request.get los datos que
[{"index":0,"Categoria":"PROVINCIA","Contenido":"El debate pol*\u00*edtico
por el Presupuesto Nacional 2019 volvi*\u00f3* a confirmar* \u2013*por
Es por ello, que les pregunto si están en conocimiento de como debería
hacer para evitar que retornen caracteres especiales al momento de hacer el
request.get().
Desde ya, muchas gracias!
Diego.
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argentina - http://www.usla.org.ar
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Facundo Batista
2018-09-24 19:13:51 UTC
Permalink
El lun., 24 de sep. de 2018 a la(s) 09:20, Diego Carabajal
Los consulto, por que estoy usando una aplicación en python 2.7 que hace un get a una api, para levantar datos de una base de datos en mysql.
Mi consulta reside, debido a que los datos almacenados en la bd no poseen ningún carácter especial, pero cuando hago un request.get los datos que vuelven poseen caracteres especiales. Por ejemplo: [{"index":0,"Categoria":"PROVINCIA","Contenido":"El debate pol\u00edtico por el Presupuesto Nacional 2019 volvi\u00f3 a confirmar \u2013por
Es por ello, que les pregunto si están en conocimiento de como debería hacer para evitar que retornen caracteres especiales al momento de hacer el request.get().
Hola Diego.
print u"El debate pol\u00edtico"
El debate político

En función de eso, no entiendo qué querés que suceda. Que la palabra
venga sin acento?

Saludos,
--
. Facundo

Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org.ar/
Twitter: @facundobatista
_______________________________________________
Lista de Correo de PyAr - Python Argentina - ***@python.org.ar
Sitio web: http://www.python.org.ar/

Para administrar la lista (o desuscribirse) entrar a http://listas.python.org.ar/listinfo/pyar

La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argentina - h
Diego Carabajal
2018-09-25 17:27:51 UTC
Permalink
Hola Facundo,

Actualmente tengo en una bd de mysql, una cierta cantidad de datos.

En la bd, veo dichos datos sin caracteres unicode.

Cuando hago un request.get(), los datos almacenados en la bd me vuelven en
formato unicode. Y a partir de ahí, se me complica el procesamiento que
necesito hacer.

El día de hoy, vi un video tuyo sobre encoding y eso me llevó a verificar
cual era el encoding que tenían los datos que voy metiendo en la bd. Ahí vi
que son unicode.

Me queda la duda, si debería hacer un encode, previo a insertarlos en la bd
y luego, antes de hacer el request, hacer un decode a formato utf-8, por
ejemplo.

Muchas gracias!

Saludos!

Diego.




El lun., 24 sept. 2018 a las 16:14, Facundo Batista (<
Post by Facundo Batista
El lun., 24 de sep. de 2018 a la(s) 09:20, Diego Carabajal
Post by Diego Carabajal
Los consulto, por que estoy usando una aplicación en python 2.7 que hace
un get a una api, para levantar datos de una base de datos en mysql.
Post by Diego Carabajal
Mi consulta reside, debido a que los datos almacenados en la bd no
poseen ningún carácter especial, pero cuando hago un request.get los datos
[{"index":0,"Categoria":"PROVINCIA","Contenido":"El debate pol\u00edtico
por el Presupuesto Nacional 2019 volvi\u00f3 a confirmar \u2013por
Post by Diego Carabajal
Es por ello, que les pregunto si están en conocimiento de como debería
hacer para evitar que retornen caracteres especiales al momento de hacer el
request.get().
Hola Diego.
Post by Diego Carabajal
print u"El debate pol\u00edtico"
El debate político
En función de eso, no entiendo qué querés que suceda. Que la palabra
venga sin acento?
Saludos,
--
. Facundo
Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org.ar/
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Facundo Batista
2018-09-25 17:40:51 UTC
Permalink
El mar., 25 de sep. de 2018 a la(s) 14:28, Diego Carabajal
Post by Diego Carabajal
Actualmente tengo en una bd de mysql, una cierta cantidad de datos.
En la bd, veo dichos datos sin caracteres unicode.
¿Estás seguro? Si vas a la BDD (para el ejemplo anterior), no ves
"político"? con tilde en la "í"? Si ves "politico" sin tilde, sería
todo muy raro. Si ves "político" con tilde (me juego a eso), por qué
decís que no tiene caracteres unicode?
Post by Diego Carabajal
Cuando hago un request.get(), los datos almacenados en la bd me vuelven en formato unicode.
No hay tal cosa como "formato unicode". Te vuelve unicode (no bytes),
porque el conector a la BDD te está haciendo la conversión desde bytes
automáticamente, que es lo correcto.
Post by Diego Carabajal
me llevó a verificar cual era el encoding que tenían los datos que voy metiendo en la bd. Ahí vi que son unicode.
Es correcto que metas la data en la BDD como unicode, y no bytes.
Post by Diego Carabajal
Me queda la duda, si debería hacer un encode, previo a insertarlos en la bd y luego, antes de hacer el request, hacer un decode a formato utf-8, por ejemplo.
No. Estás metiendo los datos bien.

Es más, ¡estás sacando los datos bien, también!

Saludos,
--
. Facundo

Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org.ar/
Twitter: @facundobatista
_______________________________________________
Lista de Correo de PyAr - Python Argentina - ***@python.org.ar
Sitio web: http://www.python.org.ar/

Para administrar la lista (o desuscribirse) entrar a http://listas.python.org.ar/listinfo/pyar

La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de Argentina - http:/
Diego Carabajal
2018-09-25 21:41:10 UTC
Permalink
Hola Facundo,

Efectivamente en la BDD, figuran palabras con tildes...

Muchas gracias por las respuestas, me sirvieron para aclarar conceptos
sobre unicode!

Saludos.

Diego.

El mar., 25 sept. 2018 a las 14:41, Facundo Batista (<
Post by Facundo Batista
El mar., 25 de sep. de 2018 a la(s) 14:28, Diego Carabajal
Post by Diego Carabajal
Actualmente tengo en una bd de mysql, una cierta cantidad de datos.
En la bd, veo dichos datos sin caracteres unicode.
¿Estás seguro? Si vas a la BDD (para el ejemplo anterior), no ves
"político"? con tilde en la "í"? Si ves "politico" sin tilde, sería
todo muy raro. Si ves "político" con tilde (me juego a eso), por qué
decís que no tiene caracteres unicode?
Post by Diego Carabajal
Cuando hago un request.get(), los datos almacenados en la bd me vuelven
en formato unicode.
No hay tal cosa como "formato unicode". Te vuelve unicode (no bytes),
porque el conector a la BDD te está haciendo la conversión desde bytes
automáticamente, que es lo correcto.
Post by Diego Carabajal
me llevó a verificar cual era el encoding que tenían los datos que voy
metiendo en la bd. Ahí vi que son unicode.
Es correcto que metas la data en la BDD como unicode, y no bytes.
Post by Diego Carabajal
Me queda la duda, si debería hacer un encode, previo a insertarlos en la
bd y luego, antes de hacer el request, hacer un decode a formato utf-8, por
ejemplo.
No. Estás metiendo los datos bien.
Es más, ¡estás sacando los datos bien, también!
Saludos,
--
. Facundo
Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org.ar/
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Juan Giudici
2018-09-26 12:25:35 UTC
Permalink
Este articulo de Joel Spolsky es muy bueno tmb para aclarar los tantos con
unicode y da una intuicion de podes pasar de ascii a unicode, etc

https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/
Post by Diego Carabajal
Hola Facundo,
Efectivamente en la BDD, figuran palabras con tildes...
Muchas gracias por las respuestas, me sirvieron para aclarar conceptos
sobre unicode!
Saludos.
Diego.
El mar., 25 sept. 2018 a las 14:41, Facundo Batista (<
Post by Facundo Batista
El mar., 25 de sep. de 2018 a la(s) 14:28, Diego Carabajal
Post by Diego Carabajal
Actualmente tengo en una bd de mysql, una cierta cantidad de datos.
En la bd, veo dichos datos sin caracteres unicode.
¿Estás seguro? Si vas a la BDD (para el ejemplo anterior), no ves
"político"? con tilde en la "í"? Si ves "politico" sin tilde, sería
todo muy raro. Si ves "político" con tilde (me juego a eso), por qué
decís que no tiene caracteres unicode?
Post by Diego Carabajal
Cuando hago un request.get(), los datos almacenados en la bd me vuelven
en formato unicode.
No hay tal cosa como "formato unicode". Te vuelve unicode (no bytes),
porque el conector a la BDD te está haciendo la conversión desde bytes
automáticamente, que es lo correcto.
Post by Diego Carabajal
me llevó a verificar cual era el encoding que tenían los datos que voy
metiendo en la bd. Ahí vi que son unicode.
Es correcto que metas la data en la BDD como unicode, y no bytes.
Post by Diego Carabajal
Me queda la duda, si debería hacer un encode, previo a insertarlos en
la bd y luego, antes de hacer el request, hacer un decode a formato utf-8,
por ejemplo.
No. Estás metiendo los datos bien.
Es más, ¡estás sacando los datos bien, también!
Saludos,
--
. Facundo
Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org.ar/
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Diego Carabajal
2018-09-26 17:08:55 UTC
Permalink
Hola Juan,

Muchas gracias por el artículo. Muy interesante....

Saludos!
Post by Juan Giudici
Este articulo de Joel Spolsky es muy bueno tmb para aclarar los tantos con
unicode y da una intuicion de podes pasar de ascii a unicode, etc
https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/
Post by Diego Carabajal
Hola Facundo,
Efectivamente en la BDD, figuran palabras con tildes...
Muchas gracias por las respuestas, me sirvieron para aclarar conceptos
sobre unicode!
Saludos.
Diego.
El mar., 25 sept. 2018 a las 14:41, Facundo Batista (<
Post by Facundo Batista
El mar., 25 de sep. de 2018 a la(s) 14:28, Diego Carabajal
Post by Diego Carabajal
Actualmente tengo en una bd de mysql, una cierta cantidad de datos.
En la bd, veo dichos datos sin caracteres unicode.
¿Estás seguro? Si vas a la BDD (para el ejemplo anterior), no ves
"político"? con tilde en la "í"? Si ves "politico" sin tilde, sería
todo muy raro. Si ves "político" con tilde (me juego a eso), por qué
decís que no tiene caracteres unicode?
Post by Diego Carabajal
Cuando hago un request.get(), los datos almacenados en la bd me
vuelven en formato unicode.
No hay tal cosa como "formato unicode". Te vuelve unicode (no bytes),
porque el conector a la BDD te está haciendo la conversión desde bytes
automáticamente, que es lo correcto.
Post by Diego Carabajal
me llevó a verificar cual era el encoding que tenían los datos que voy
metiendo en la bd. Ahí vi que son unicode.
Es correcto que metas la data en la BDD como unicode, y no bytes.
Post by Diego Carabajal
Me queda la duda, si debería hacer un encode, previo a insertarlos en
la bd y luego, antes de hacer el request, hacer un decode a formato utf-8,
por ejemplo.
No. Estás metiendo los datos bien.
Es más, ¡estás sacando los datos bien, también!
Saludos,
--
. Facundo
Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org.ar/
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Loading...