Lo Traductor Automactico Português-Portuñol

Este tradutor foi escrito por Elcio Ferreira usando Python, a linguagem de programação mais divertida do mundo.

Para poupar recursos em meu servidor, cada URL traduzida permanece em cache por 24 horas. Mesmo assim, pode demorar para traduzir uma página. Seja paciente.

Após buscar a página, é feita uma tentativa de detecção de charset. Primeiro o tradutor procura por uma tag meta content-type com informações de charset. Se isso falhar ele tenta detectar codificando o texto da página. Se falhar novamente, ele entende que a página é UTF-8. Eu sei que um user-agent de verdade deveria enviar headers com os charsets aceitos, ler headers de servidor e o prolog xml, mas o que temos hoje é suficiente para a esmagadora maioria das páginas em português e, afinal, isso tudo é só uma piada mesmo.

A requisição é feita usando a urllib, com a string de user-agent padrão. O controle de cache é feito com pickle e a interpretação e tradução do HTML é feita com a SGMLlib usando o excelente processador de HTML do Mark Pilgrim. A tradução de cada trecho de texto dentro do HTML é feita com expressões regulares e a página web é servida com PSE.