[linux] Re: recoden van CD bestandsnamen

Geert Stappers stappers op stappers.nl
Wo mei 7 17:52:28 CEST 2008


Op 07-05-2008 om 16:53 schreef Aart Koelewijn:
> Hallo,
> 
> ik heb 2 cd's met oude Tsjechische foto's. Die wil ik kopiƫren naar 1
> cd. Het kopieerprogramma klaagt echter dat het veel bestandsnamen niet
> kan lezen. Ik vermoed dat die in een oost-Europese (windows ?)
> characterset  staan. De foto's zijn nu allemaal gekopieerd (bijna 2000)
> naar mijn harde schijf.
> 
> Voorzover ik weet stonden de foto's oorspronkelijk op 1 dvd of cd en
> zijn via een dvd-recorder gekopieerd naar 2 cd's, niet omdat ze niet
> pasten op 1 cd, maar omdat de gebruikte apparatuur maximaal 999 titels
> kon kopiƫren.
> 
> Nu vraag ik me af of er, b.v. met recode een eenvoudige manier is om al
> deze bestandnamen om te zetten in een characterset die wel herkend wordt
> (b.v. UTF-8). Ik vermoed iets met find etc maar bij bestuderen van de
> man-page kom ik er niet direct uit en ik weet dat hier wel een paar
> find-goochelaars zitten.
> 
> Een bijkomend probleempje is nog, dat ik er nog niet achter kan komen
> wat de oorspronkelijke characterset is. Ik heb met Firefox de voor de
> handliggende sets geprobeerd, IBM-852 komt in de buurt maar herkent ook
> niet alle characters. Windows-1250 is het niet en ISO-8859-2 ook niet.

Van de manual page van het programma mount:

|   codepage=value
|         Sets the codepage for converting to shortname characters on FAT
|         and VFAT filesystems. By default, codepage 437 is used.
en ook
|   The following options are the same as for vfat and specifying them only
|   makes sense when using discs encoded using  Microsoft's Joliet  extesions.
|
|  iocharset=value
|        Character set to use for converting 16 bit Unicode characters on
|        CD to 8 bit characters. The default is iso8859-1.
|
|  utf8  Convert 16 bit Unicode characters on CD to UTF-8.

Dat is de richting die ik je op wil sturen.

En eens kijken of ik het ook uit kan leggen.

Characterset encoding is iets wat over twee kanalen gaat.
Over een kanaal de data en over het andere kanaal wordt vertelt
in welke character set de data staat.

Iets soortsgelijks:
 Iemand zegt 'bellen' over het data kanaal.
 Als het beschrijvingskanaal zegt dat het een Nederlander was,
 dan wordt er telefoneren bedoelt.
 Als het beschrijvingskanaal zegt dat het een Duitser was,
 dan wordt blaffen bedoelt.


Bij de CDs lezen is het datakanaal snel genoeg gevonden,
het beschrijvingskanaal goed zetten is de crux.


Ik hoop dat het de vraag

> Nog suggesties wat ik zou kunnen proberen?

beantwoordt.



Cheers
Geert Stappers



More information about the Linux mailing list