проблема с кодированием / декодированием python

#python #google-app-engine

#python #google-app-engine

Вопрос:

Я пытаюсь использовать объект шаблона Python для создания электронных писем в формате html. Однако, когда приложение пытается отправить электронные письма, я получаю сообщение об ошибке:

 File "/base/data/home/apps/hanksandbox/1.350486862928605153/main.py", line 573, in post
html = messages.email_document_html(document)
File "/base/data/home/apps/hanksandbox/1.350486862928605153/messages.py", line 109, in email_document_html
description = document.get_description()
File "/base/python_runtime/python_dist/lib/python2.5/string.py", line 170, in substitute
return self.pattern.sub(convert, self.template)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 763: ordinal not in range(128)
  

Код, на который ссылается ошибка, выглядит следующим образом:

 def email_document_html(document):
email_document = Template("""
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
<head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
    ${stylesheet}
</head>
<html>
<body>
<h1 id="mainhead">Essays</h1>
<div class="document">
<span class="info">At ${date} ${author} published:</span><br/><hr/>
<a href="${domain}/${author}/document/${filename}/" target="_blank"><h1 class="title">${title}</h1></a>
<p class="description">${description}</p>
</div>
</body>
</html>
""")
return email_document.substitute(
                                 stylesheet=style,
                                 date=str(document.date),
                                 author=document.author.username,
                                 domain=domainstring,
                                 filename=document.filename,
                                 title=document.title,
                                 description = document.get_description()
                                 )
  

Моя среда разработки использует UTF-8 в качестве набора символов. Я попытался добавить # coding: utf-8 в свои файлы. Я пробовал добавлять .encode("utf-8") or .decode("utf-8") в различных местах, особенно после ‘document.get_description()’. Но я хватаюсь за соломинку.

Есть предложения?

Ответ №1:

Используйте unicode везде.

 email_document = Template(u"""
 ...
  

«Unicode в Python, полностью демистифицированный»

Ответ №2:

Поставьте u перед строкой вашего шаблона, чтобы указать, что это должна быть строка в юникоде. Python < 3 интерпретирует подобные строки как ASCII, если не указано иное.

 email_document = Template(u"""
...
  

Комментарии:

1. Спасибо! Не могу поверить, что я часами плавил свой мозг над одной маленькой буквой u .