GdM a écrit :...Bien sûr, mais ce [les cahiers Léon Trotsky sur marxists.org] sont des photocopies des pages, alors que sur ce site [http://cahiers-leon-trotsky.eu/], il est proposé des fichiers corrigés aux formats textes pdf et word. Ce n’est pas pareil : c’est utilisable...
com a écrit :...Vérification faite (sur le numéro 1), non, les .pdf de marxists.org ne sont pas des fac-similés, mais incluent la reconnaissance des caractères (OCR).
Quelques tentatives d'explications :
Les .pdf peuvent être de simples images scannées, comme des photocopies (ex. les scans des vieux numéros de VO et LO https://journal.lutte-ouvriere.org/journal/archives). Dans ce cas, ils peuvent être lus sur ordi ou sur tablette, mais on ne peut pas y faire des recherches de mots ou d'expressions, ou les transformer en ebooks lisibles aisément sur une liseuse.
Ou alors les .pdf issus d'un scan peuvent, bien qu'ayant le même aspect de photocopies, inclure une reconnaissance caractère par caractère [OCR]. Dans ce cas (ex : https://www.marxists.org/francais/clt/index.htm) on pourra lancer des recherches, faire des copier-coller et en faire aisément - avec le logiciel calibre - des ebooks, lisibles sur liseuse.
Les .pdf obtenus à partir d'un logiciel de traitement de texte (comme word), incluent évidemment la reconnaissance caractère par caractère. (ex. http://cahiers-leon-trotsky.eu/)