#mysql #database #utf-8 #go #iso-8859-1
#mysql #База данных #utf-8 #Вперед #iso-8859-1
Вопрос:
Я разрабатываю проект, в котором нам нужно сохранить нашу информацию в устаревшей базе данных, содержащей таблицы ISO-8859-1. Поэтому, прежде чем записывать что-либо в базу данных, мне нужно преобразовать это из UTF-8 в ISO-8859-1, и каждый раз, когда я извлекаю это из базы данных, мне нужно преобразовать это обратно в UTF-8.
Я пытался использовать библиотеку code.google.com/p/go-charset как следующее для каждого текстового поля, которое мне нужно сохранить.
import (
"bytes"
"code.google.com/p/go-charset/charset"
_ "code.google.com/p/go-charset/data"
"fmt"
"io/ioutil"
"strings"
)
func toISO88591(utf8 string) string {
buf := new(bytes.Buffer)
w, err := charset.NewWriter("latin1", buf)
if err != nil {
panic(err)
}
defer w.Close()
fmt.Fprintf(w, utf8)
return buf.String()
}
func fromISO88591(iso88591 string) string {
r, err := charset.NewReader("latin1", strings.NewReader(iso88591))
if err != nil {
panic(err)
}
buf, err := ioutil.ReadAll(r)
if err != nil {
panic(err)
}
return string(buf)
}
Проблема в том, что данные по-прежнему сохраняются в UTF-8, даже если я использую функцию toISO88591. Я делаю что-то не так в этом преобразовании?
Моя база данных — это MySQL, и я использую github.com/go-sql-driver/mysql драйвер со следующими параметрами подключения:
<user>:<password>@tcp(<host>:<port>)/<database>?collation=latin1_general_ci
С наилучшими пожеланиями!
Ответ №1:
import "code.google.com/p/go-charset/charset"
func NewWriter(charset string, w io.Writer) (io.WriteCloser, error)
NewWriter
возвращает новуюWriteCloser
запись вw
. Он преобразует
записывает текст в формате UTF-8 в записи наw
текста в именованном символе
установлено.Close
Необходимо очистить все оставшиеся частично
переведенные символы в выходные данные.
Я бы следовал инструкциям: « Close
Необходимо удалить все оставшиеся частично переведенные символы в выходные данные». Например,
package main
import (
"bytes"
"code.google.com/p/go-charset/charset"
_ "code.google.com/p/go-charset/data"
"fmt"
"io/ioutil"
"strings"
)
func toISO88591(utf8 string) (string, error) {
buf := new(bytes.Buffer)
w, err := charset.NewWriter("latin1", buf)
if err != nil {
return "", err
}
fmt.Fprintf(w, utf8)
w.Close()
return buf.String(), nil
}
func fromISO88591(iso88591 string) (string, error) {
r, err := charset.NewReader("latin1", strings.NewReader(iso88591))
if err != nil {
return "", err
}
buf, err := ioutil.ReadAll(r)
if err != nil {
return "", err
}
return string(buf), nil
}
func main() {
utfi := "£5 for Peppé"
fmt.Printf("%qn", utfi)
iso, err := toISO88591(utfi)
if err != nil {
fmt.Println(err)
}
fmt.Printf("%qn", iso)
utfo, err := fromISO88591(iso)
if err != nil {
fmt.Println(err)
}
fmt.Printf("%qn", utfo)
fmt.Println(utfi == utfo)
}
Вывод:
"£5 for Peppé"
"xa35 for Peppxe9"
"£5 for Peppé"
true
Комментарии:
1. Спасибо за совет! На самом деле проблема заключалась в PEBKAC. Инструмент luit, который я использую на терминале, обманул меня. =)
2. больше невозможно импортировать эту библиотеку, она не обслуживается с указанной конечной точки