Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Tiedonsiirrossa merkistön koodaus voi on haasteellista jos tekstitiedoissa esintyy esim. Kyrillisiä tai Aasialaisisa merkkejä.
Myös ns. tavalliset ääkköset, skandit voivat mennä väärin Excelin kautta käsiteltynä kun tiedostoja tallennetaan csv-muotoon.

Jos kyseistä csv-lähdedataa käsitellään ensin Excelissä avaa asennuspaketin mukainen 3A lähdetiedosto pohjaksi suoraan ja tallenna aineisto aina csv-tiedostona,
älä siis tallenna välillä Excel .xlsx tai .xls muotoon kuten Excel ehdottaa, muuten riskinä on että merkistön koodaukset menee sekaisin.
Kohdan vanha calc-ohjelman UTF8-ohje auttaa jos tässä merkistön kanssa on ongelmia.

Jos csv-aineisto muodostetaan suoraan julkaisujärjestelmän tietokannasta tekstitiedostoon on varmistettava että tiedoston merkistö on UTF8-muodossa.

Merkistöä voi tarkistaa esim. Notepad++ ohjelmalla ja myös varovasti tehdä suoraan pieniä korjauksia.
Notepad++ on avoimeen lähdekoodiin pohjautuva tekstieditori ja ladattavissa: https://notepad-plus-plus.org/

Jos avatussa csv-tiedostossa Notepad++ kautta avattuna näkyy esim. tällaista tekstiä:

...