6

La mudanza de eCuaderno (parte V: cómo convertir a UTF-8)

Este punto es esencial para conservar los caracteres tal y como se escribieron en MT. Les recuerdo que partimos de la base de que queremos codificar WP como UTF-8.

Vamos a ver cómo se hace tanto en Mac como en Windows. Buscamos disponer de un fichero llamado, por ejemplo, “export.txt” con la base de datos de MT en formato de texto y codificado como ISO-8859-1. Según el post anterior, dedicado a la mudanza de eCuaderno, ese fichero se consigue exportando la base de datos desde MT y, una vez que veamos la página en un navegador con motor Gecko (por ej. Firefox) iremos a la opción Archivo > Guardar Página Como…

Para convertir en Mac:

Usaremos un editor de textos que permita la conversión, como Taco que es nuestro favorito. Abriremos el archivo “export.txt” y, sin modificar nada, lo salvaremos con el mismo nombre pero cambiando el tipo de fichero (file type) de texto plano a UTF-8. Et voilà!. ¡Cuidado!, porque si lo abrimos con TextEdit seguiremos viendo mal los caracteres de vocales acentuadas, “ñ”, etc.

Para convertir en Windows (XP):

Abrir el archivo “export.txt” (ISO) con el bloc de notas. Seguramente veremos el fichero bastante ilegible, todo seguido, sin los saltos de línea. No nos preocupemos, lo guardamos con el mismo nombre, pero activando la codificación UTF-8 y listo. Si lo volvemos a abrir con el bloc de notas continuaremos viéndolo sin saltos de línea, pero escudriñando un poco podremos leer los caracteres de letras acentuadas, la “ñ”, etc. correctamente. ¡Si lo abrimos con WordPad lo leeremos perfectamente!.

Como ven, el truco consiste en salvar el archivo en formato UTF-8 con un programa que así lo permita, tanto en Mac como en Windows.

En el próximo post de la Mudanza a WP de eCuaderno veremos cómo mantener el ID en el blog de WP. Para ello hay que modificar el script que exporta la base de datos en MT. No se apuren que es muy fácil.

Después de eso, ya podremos importar el fichero “export.txt” (codificado UTF-8) a WP. Veremos cómo y también habrá que modificar el script php que lo hace para añadir el ID.

Conviene hacer pruebas de la conversión con un sólo post de la base de datos de MT. Para ello, se puede salvar sólamente el primer post en la operación de export. Nótese que los posts comienzan con “AUTHOR:” y terminan con una serie de quiones, “——–”, antes del siguiente “AUTHOR”. Esto nos facilitará el trabajo, pudiendo fácilmente borrar y volver a importar el post, en caso de errores. También nos permitirá comprobar con facilidad si todos los elementos del post (autor, categorías, comentarios, trackbacks, etc.) se importan correctamente.

Cuando ya esté todo listo, repetiremos el export y el import para migrar la base de datos completa, borrando previamente los posts de pruebas.

[Leer algo más sobre UNICODE e ISO]

También puedes leer:

Si te ha gustado el post, no olvides suscribirte a nuestro feed RSS





6 Comentarios »

RSS feed para los comentarios de esta entrada. TrackBack URI

  1. muy bueno el “truqui” para los acentos y las eñes, el trabajito que me di yo poniendo acentos!aysssch! :-)

    Comentario por koon — October 2, 2005 #

  2. Gracias, gracias, gracias…

    Despues de 1 semana volviéndome loco con una base de datos de 11 megas y un cambio de servidor que me jodio todo, esto me dió la luz…, ya lo podían poner en el manual del MySQL y dejarse de tanta po#a….

    Ya puedo estar tranquilo y ya puedo contraselo al administrador del servidor que no tenía ni p. idea de como hacer…

    Como cambia la vida, los usuarios haciendo el curre de los administradores… :/

    Comentario por NoRules — November 18, 2005 #

  3. Buenísimo! Estaba volviéndome loco con la migración de un servidor a otro y no conseguía resolver el tema de los acentos, y gracias a tu post lo he resuelto en un momento.

    Gracias mil por el truquillo.

    Comentario por jon — January 7, 2006 #

  4. Hola muy buena sugerencia!

    Pero si quieren algo aun mejor, les recomiendo el Notepad2 esta de lux!

    Notepad2
    http://www.flos-freeware.ch/notepad2.html

    Inlcuye entre otras cosas la opcion de mostrar los numeros de línea.

    SalU2!!

    Comentario por gutielua — September 7, 2006 #

  5. [...] hay algo que me va a salir desconfigurado: los posts o los comentarios. He probado ?sta soluci?n, y ?sta, y ?sta, pero ninguna me ha funcionado. Si se os ocurre alguna otra, la habeis probado y os ha [...]

    Pingback por Octaedro » Una soluci?n quiero — November 15, 2007 #

  6. No entendí eso de MT, que rayos es?? porque es mi primera vez entrando aqui y me extravie. Podrían ser un tanto mas claritos en eso de el cambio, por favor.

    Gracias.

    PD: por si me quieren aclarar un tanto la situación de este post, pueden enviarme un email a correo1503 en gmail, porque de verdad me interesa.

    Comentario por Mario — September 1, 2008 #

Dejar un comentario

XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Tanto el autor de este blog, Antonio Cambronero, como sus cobloguers, hacen devolución expresa del contenido de sus posts al Dominio Público
CMS: WordPress - Tema basado en GimpStyle diseñado por Horacio Bella - Hosting: Ferca Network
Recibir las actualizaciones por correo-e
Feeds de Entradas y Comentarios
Política de privacidad