Tiedonsiirrossa merkistön koodaus voi on haasteellista jos tekstitiedoissa esintyy esim. Kyrillisiä tai Aasialaisisa merkkejä.
Myös ns. tavalliset ääkköset, skandit voivat mennä väärin Excelin kautta käsiteltynä kun tiedostoja tallennetaan csv-muotoon.
Jos kyseistä csv-lähdedataa käsitellään ensin Excelissä avaa asennuspaketin mukainen 3A lähdetiedosto pohjaksi suoraan ja tallenna aineisto aina csv-tiedostona,
älä siis tallenna välillä Excel .xlsx tai .xls muotoon kuten Excel ehdottaa, muuten riskinä on että merkistön koodaukset menee sekaisin.
Kohdan vanha calc-ohjelman UTF8-ohje auttaa jos tässä merkistön kanssa on ongelmia.
Jos csv-aineisto muodostetaan suoraan julkaisujärjestelmän tietokannasta tekstitiedostoon on varmistettava että tiedoston merkistö on UTF8-muodossa.
Merkistöä voi tarkistaa esim. Notepad++ ohjelmalla ja myös varovasti tehdä suoraan pieniä korjauksia.
Notepad++ on avoimeen lähdekoodiin pohjautuva tekstieditori ja ladattavissa: https://notepad-plus-plus.org/
Jos avatussa csv-tiedostossa Notepad++ kautta avattuna näkyy esim. tällaista tekstiä:
...