GoLang — Сохраняется с использованием кодировки ISO-8859-1

#mysql #database #utf-8 #go #iso-8859-1

#mysql #База данных #utf-8 #Вперед #iso-8859-1

Вопрос:

Я разрабатываю проект, в котором нам нужно сохранить нашу информацию в устаревшей базе данных, содержащей таблицы ISO-8859-1. Поэтому, прежде чем записывать что-либо в базу данных, мне нужно преобразовать это из UTF-8 в ISO-8859-1, и каждый раз, когда я извлекаю это из базы данных, мне нужно преобразовать это обратно в UTF-8.

Я пытался использовать библиотеку code.google.com/p/go-charset как следующее для каждого текстового поля, которое мне нужно сохранить.

 import (
  "bytes"
  "code.google.com/p/go-charset/charset"
  _ "code.google.com/p/go-charset/data"
  "fmt"
  "io/ioutil"
  "strings"
)

func toISO88591(utf8 string) string {
    buf := new(bytes.Buffer)

    w, err := charset.NewWriter("latin1", buf)
    if err != nil {
        panic(err)
    }
    defer w.Close()

    fmt.Fprintf(w, utf8)
    return buf.String()
}

func fromISO88591(iso88591 string) string {
    r, err := charset.NewReader("latin1", strings.NewReader(iso88591))
    if err != nil {
        panic(err)
    }

    buf, err := ioutil.ReadAll(r)
    if err != nil {
        panic(err)
    }

    return string(buf)
}
  

Проблема в том, что данные по-прежнему сохраняются в UTF-8, даже если я использую функцию toISO88591. Я делаю что-то не так в этом преобразовании?

Моя база данных — это MySQL, и я использую github.com/go-sql-driver/mysql драйвер со следующими параметрами подключения:

 <user>:<password>@tcp(<host>:<port>)/<database>?collation=latin1_general_ci
  

С наилучшими пожеланиями!

Ответ №1:

кодировка пакета

 import "code.google.com/p/go-charset/charset" 
  

функция NewWriter

 func NewWriter(charset string, w io.Writer) (io.WriteCloser, error)
  

NewWriter возвращает новую WriteCloser запись в w . Он преобразует
записывает текст в формате UTF-8 в записи на w текста в именованном символе
установлено. Close Необходимо очистить все оставшиеся частично
переведенные символы в выходные данные.


Я бы следовал инструкциям: « Close Необходимо удалить все оставшиеся частично переведенные символы в выходные данные». Например,

 package main

import (
    "bytes"
    "code.google.com/p/go-charset/charset"
    _ "code.google.com/p/go-charset/data"
    "fmt"
    "io/ioutil"
    "strings"
)

func toISO88591(utf8 string) (string, error) {
    buf := new(bytes.Buffer)
    w, err := charset.NewWriter("latin1", buf)
    if err != nil {
        return "", err
    }
    fmt.Fprintf(w, utf8)
    w.Close()
    return buf.String(), nil
}

func fromISO88591(iso88591 string) (string, error) {
    r, err := charset.NewReader("latin1", strings.NewReader(iso88591))
    if err != nil {
        return "", err
    }
    buf, err := ioutil.ReadAll(r)
    if err != nil {
        return "", err
    }
    return string(buf), nil
}

func main() {
    utfi := "£5 for Peppé"
    fmt.Printf("%qn", utfi)
    iso, err := toISO88591(utfi)
    if err != nil {
        fmt.Println(err)
    }
    fmt.Printf("%qn", iso)
    utfo, err := fromISO88591(iso)
    if err != nil {
        fmt.Println(err)
    }
    fmt.Printf("%qn", utfo)
    fmt.Println(utfi == utfo)
}
  

Вывод:

 "£5 for Peppé"
"xa35 for Peppxe9"
"£5 for Peppé"
true
  

Комментарии:

1. Спасибо за совет! На самом деле проблема заключалась в PEBKAC. Инструмент luit, который я использую на терминале, обманул меня. =)

2. больше невозможно импортировать эту библиотеку, она не обслуживается с указанной конечной точки