Belépés
Karakterkódolás
2007. november 3. – 09.16 – x3cut0r
Hello! Nem rég tértem át linuxra természetesen window$ról. Szóval kezdőként meggyűlt a bajom a karakterkódolással. Átkódolásra már találtam megfelelő alkalmazást (recode, convmv), de Én szeretném megtudni milyen kódolásban volt eredetileg a fájl. Valószínűleg már átkódoltam olyan formátumról a fájlt amiben nem is volt, utf8ra. Jelenleg kérdőjelekkel helyettesíti az ékezetes karaktereket. Mivel oldható meg a probléma? Köszönöm.
- A hozzászóláshoz regisztráció és belépés szükséges
Hali!
Gondolom általában a sima szöveges fájlokkal van a problémád. Ezek általában iso 8859-2 -es kódolásúak, és ha megnyitod őket, akkor csúnyaságokat látsz az ékezetek helyén. Én kwrite -ot használok szöveges fájlok nézegetésére, Eszközök/Kódolás részben kiválasztom az iso 8859-2 -es kódolást, erre normálisan látszódnak az ékezetek.
Ha van valamilyen kódolású szöveged, azt más kódolásba akarod elmenteni, akkor ne az eredeit írd felül, mert csúnyaságok történhetnek.
A feliratokat szerintem nem érdemes átkódolni, mert rosszabbul fognak megjelenni, mint eddig voltak, legalábbis én ezt tapasztaltam annak idején Fedora alatt.
Uhu 2.0 alatt ékezetekkel nekem nem volt problémám.
"Örök világosság részese leszek, többé szó szívem nem gyengíti meg."
A kwrite meg tudja mondani hogy milyen kódolásban van a szöveg? Ez lenne igazából a lényeg. Egyébként köszönöm a hozzászólást. Már azt hittem senkit nem érdekel.
A kwrite mindent utf8 -ként akar értelmezni mostmár. Régebben probléma volt abból, hogy egyes programok utf8 -at, másik programok iso 8859-2 -t használtak, ebből elég nagy keveredés volt. Később a legtöbb linux disztriben már egyezményesen alap az utf8.
Azt, hogy a szöveg milyen kódolásban készült, nem tudom honnan lehet kideríteni, biztos van rá mód, de én ehhez nem értek. Az egyes programokban (pl feliratszerkesztők, webszerkesztők) elvileg autómatikus karakterfelismerés van, ami lényegében nem teljesen fedi a valóságot, mert mindent ugyanúgy utf8 -ként akar megnyitni.
Magyar windows alatt készített txt szövegfájlok iso 8859-2 -es kódolásban vannak tudtommal, ezeket szerintem felesleges átkonvertálgatni utf8 -ra, mert valami egyszerű szövegszerkesztővel megnyitod, kódolást átállítod, és máris olvasható.
Szerencsére az office -os (ms office, openoffice) dokumentumokkal nincs ilyen probléma.
http://ubuntu.hu/forum-tema/ekezetek
"Örök világosság részese leszek, többé szó szívem nem gyengíti meg."
Használhatod pl. a Kate szerkesztőt abban fájl megnyitása után is tudod változtatni a karakterkódolást, de az alapértelmezetten települő gedit-ben is meg lehet adni (megnyitáskor: File -> Open) hogy milyen karakterkódolást használjon.