FAQ WordCheck

From DPWiki
Jump to: navigation, search
DP Official Documentation - Proofreading
Languages: English Français


Le contenu de cette page est périmé et la traduction demande une mise à jour. Si vous avez des questions, veuillez contacter l'un de ses éditeurs (lien tout en bas de cette page).

Questions générales

Quid de la nouvelle interface

WordCheck est la nouvelle version du correcteur orthographique intégré à l'interface de relecture.

  • Les mots signalés à l'attention du relecteur peuvent être édités directement.
  • On peut voir l'image en même temps que la page WordCheck.
  • Le texte est vérifié avec les dictionnaires des différentes langues du projet. L'utilisateur peut en plus choisir une langue supplémentaire à la demande, utile par exemple pour vérifier une longue citation en anglais dans un projet en français.
  • chaque projet a une liste de mots corrects et de mots douteux. les mots corrects sont ceux qui sont valables pour le projet bien qu'absents du dictionnaire (par exemple, des noms propres); les mots douteux sont des mots qui doivent être signalés à l'attention du relecteur, même s'il se peut qu'ils existent dans le dictionnaire (par exemple des scannos furtives spécifiques au projet). Ces deux listes sont gérées par le chef de projet.
  • Les mots non reconnus dans le dictionnaires sont présentés avec un bouton "Unflag All & Suggest" (tout masquer et suggérer) Book-Plus-Small.gif. Le relecteur clique sur ce bouton pour signaler que le mot est correct dans l'image.
  • Les mots signalés comme corrects sont proposés pour revue au chef de projet, qui peut en inclure les plus courants dans la liste de mots corrects du projet.

Quels sont les mots signalés à l'attention du relecteur?

Il y a différents niveaux de filtrage réalisé sur les mots:

  • Linguistique: les mots absents du dictionnaire du correcteur orthographique sous-jacent (aspell)
  • Site: pour chaque langue, il y a la possibilité d'avoir une liste globale, sur tout le site, de mots corrects (bien qu'absents du dictionnaire) et une liste globale de mots douteux (bien que présents dans le dictionnaire).
  • Projet: chaque projet a sa propre liste de mots corrects ou douteux.

Chaque niveau a priorité par rapport au niveau précédent. Ainsi, un mot non reconnu par le correcteur orthographique sous-jacent, mais figurant dans la liste globale de mots corrects pour la langue du projet, sera considéré comme correct (et ne sera donc pas signalé à l'attention du relecteur)... sauf si ce mot apparaît dans la liste de mots douteux du projet.

Enfin, il y a également des structures de mots qui sont codées dans le code comme étant systématiquement douteuses: par exemple un mot mélangeant lettres et chiffres sera douteux (sauf exceptions pour les ordinaux: 1st, 2nd, 3rd, ...)

Exemple

Chantier.png (à compléter)

Majuscules

Les mots sont traités comme des chaînes de caractères pour décider s'ils sont corrects ou douteux. Par exemple on peut mettre "Einstein" dans une liste de mots corrects sans pour autant qu' "einstein" cesse d'être signalé, et on peut mettre "Gela" dans une liste de mots douteux (scanno courante pour "Cela") sans pour autant que "gela" en minuscule cesse d'être correct.

Questions du relecteur

Pourquoi utiliser un correcteur orthographique? Je connais l'orthographe!

Il s'agit de faire bien plus que de vérifier l'orthographe. WordCheck aide à détecter les scannos et autres erreurs d'OCR. Il aide même à détecter certaines scannos furtives, qui correspondent à des mots existants mais très probablement des scannos.

Dois-je lancer WordCheck avant ou après avoir relu la page?

Ça dépend de vous.

Certains utilisent WordCheck comme une première passe rapide, pour leur permettre d'éliminer les erreurs les plus flagrantes d'abord et ainsi moins risquer de perdre sa concentration en tombant sur des erreurs lors de la relecture.

D'autres préfèrent relire la page entièrement depuis le mode d'édition de texte, et ensuite d'utiliser WordCheck pour se rassurer sur le fait qu'ils ont détecté toutes les erreurs.

Il y a encore d'autres approches. Utilisez celle qui vous réussit le mieux.

Qu'est-ce que ce bouton en forme de croix?

Le bouton représentant un livre et un signe plus (Book-Plus-Small.gif) permet aux relecteurs d'indiquer que le mot est présent dans l'image. Une fois cliqué, toutes les autres instances du mot dans la même page cessent d'être signalées, exactement comme si ce mot était correct. Le mot est par ailleurs enregistré dans une liste de suggestions, que le chef de projet peut exploiter pour mettre à jour la liste de mots corrects du projet.

Quand un mot a été modifié, le bouton devient désactivé.

Les mots cliqués ne subsistent pas entre deux sessions de WordCheck, que ce soit sur la même page ou sur deux pages différentes.

Faut-il cliquer sur ce bouton pour tous les mots de la page?

Non, si un mot signalé à l'attention du relecteur correspond à ce qui est présent dans l'image, il n'y a aucune exigence de faire quoi que ce soit. Si, outre le fait qu'il est correct, ce mot apparaît plusieurs fois dans la page, ou est susceptible d'apparaître de nombreuses fois dans le projet (par exemple un terme technique ou un nom propre), la possibilité est offerte, à votre choix, de cliquer le bouton et ainsi de le faire figurer dans les suggestions de mots à destination du chef de projet.

Pourquoi certains mots signalés n'ont-ils pas de bouton?

Les mots qui sont sur une liste de mots douteux (soit globale au site, soit propre au projet), n'ont pas de bouton "masquer et suggérer", pour garantir que chaque occurrence fait l'objet de l'attention du relecteur.

Que faire quand on clique à tort sur le bouton pour un mot?

Pas de panique! Le mot n'est pas ajouté automatiquement sur la liste des mots corrects, il est simplement proposé au chef de projet. Quittez WordCheck et corrigez le mot (dans l'interface normale, ou bien en relançant WordCheck puisque les mots cliqués ne sont pas conservés d'une session à l'autre).

Normalement le chef de projet doit vérifier que les mots suggérés sont pertinents et corrects avant de les inclure dans la liste de mots corrects. Si vraiment vous avez une raison particulière de penser que le chef de projet puisse ajouter à tort ce mot, vous pouvez lui envoyer un message privé en indiquant ce qui s'est passé.

Comment puis-je ajouter un mot aux listes du projet?

Seul le chef de projet peut ajouter des mots dans la liste de mots corrects du projet. La façon par défaut est de cliquer sur le mot depuis WordCheck et d'attendre que le chef de projet mette à jour ses listes.

Il n'y a pas de bouton pour signaler des mots douteux, pour cette raison on encourage les relecteurs à proposer des mots à inclure dans la liste de mots douteux du projet dans le forum de discussion du projet.

Comment vérifier la page dans une autre langue?

En sélectionnant la langue supplémentaire dans la liste déroulante en haut de la page WordCheck, et en cliquant sur "Check" pour re-vérifier avec les langues du projet et la langue ad-hoc. Seule une langue ad-hoc peut être utilisée à un moment donné, un nouveau choix annule le précédent.

Chantier.png (je ne sais pas si le choix d'une langue active le choix des listes globales du site pour cette langue ad-hoc)

Questions pour le chef de projet

Où sont les listes globales du site?

Les listes globales actuelles sont les suivantes:

Nom Nombre de mots Modifiée le
bad_words.eng.txt 345 2 mars 2007
bad_words.fre.txt 63 2 mars 2007
bad_words.ita.txt 8 8 mars 2007
good_words.dut.txt 2973 2 mars 2007
good_words.fre.txt 1728 15 novembre 2009

Il existe également des listes pour suggérer au chef de projet des mots potentiellement douteux:

Nom Nombre de mots Modifiée le
possible_bad_words.eng.txt 261 2 mars 2007
possible_bad_words.ger.txt 7236 22 février 2008

(Dernière mise à jour en novembre 2009 sur l'original anglais)

Comment voir les listes du projet?

Elles sont accessibles depuis la page de projet, et modifiables en cliquant sur le lien "edit WordCheck lists".

Quels dictionnaires sont installés sur le site?

Les dictionnaires pour les langues suivantes sont disponibles:

  • Catalan - catalan
  • Czech - tchèque
  • Danish - danois
  • Dutch - néerlandais
  • English - anglais
  • Esperanto - esperanto
  • Finnish - finnois
  • French - français
  • German - allemand
  • Icelandic - islandais
  • Irish - irlandais
  • Italian - italien
  • Latin - latin
  • Norwegian - norvégien
  • Norwegian Bokmål - norvégien Bokmål
  • Norwegian Nynorsk - norvégien Nynorsk
  • Portuguese - portugais
  • Slovenian - slovénien
  • Spanish - castillan
  • Swedish - suédois
  • Tagalog - tagalog
  • Welsh - gaélique

Puis-je ajouter une langue supplémentaire?

Pas directement pour l'instant. Cf. FAQ WordCheck anglaise.

Que sont les patterns globales?

WordCheck détecte des structures suspectes, comme par exemple un "mot" mélangeant des lettres et des chiffres. Ces "mots" sont considérés comme étant douteux et ne sont pas présentés avec un bouton "masquer et suggérer". Les exceptions courantes, comme les ordinaux (1st, 2nd, 3rd...) en anglais et en français sont supportées. D'autres exceptions peuvent être envisagées mais nécessitent des modification du code.

Que dois-je faire? Comment gérer les listes du projet?

Au minimum, le chef de projet peut ne rien faire, et laisser le système fonctionner avec le dictionnaire du correcteur sous-jacent et les listes globales du site. Mais le mieux est de définir des listes de mots corrects et douteux pour le projet. Cela peut être fait lors du pré-traitement, ou bien incrémentalement en utilisant la palette d'outils du site. Ces outils du site peuvent être utilisés à tout moment, sans interrompre la relecture.

Les listes de mots doivent contenir exactement un mot par ligne. Les espaces à gauche sont retirés, ainsi que tout ce qui est à la droite du premier mot de la ligne. Cela permet le copier-coller direct de parties des listes téléchargées, en ignorant les fréquences d'apparitions présentes dans les listes affichées.

le lien "Show words in the project that WordCheck would currently flag" donne la liste des mots du projet qui seraient signalés par WordCheck. Les mots sont présentés avec leur fréquence, et une case à cocher. Vous pouvez régler la fréquence d'apparition en-deçà de laquelle les mots ne sont pas affichés.

Vous pouvez soit procéder par copier-coller depuis cette page pour ajouter des mots dans le cadre éditable de la liste de mots corrects, ou bien utiliser les cases à cocher et cliquer sur "add selected words". Dans tous les cas évitez d'ajouter dans la liste par mégarde des mots incorrects fréquents.

L'autre source de mots corrects est constitués par les suggestions des relecteurs. On y accède par le lien "Show suggestions from proofers", qui les présente d'une façon plus commode que l'information brute figurant dans le fichier "Good Words Suggestions" de la page du projet.

Les listes de mots douteux sont gérées de manière analogue. Le lien "Show words in the project that are in the site possible bad words file" montrera les mots qui sont potentiellement douteux.

Il y a également un lien "Suggestions from diff analysis" qui affiche les mots modifiés entre deux tours: si de nombreuses occurrences du mot "piège" ont été corrigées en "piége", il est probable que tous les "piège" restants sont des scannos, et on peut inclure ce mot parmi les mots douteux du projet depuis cette page.

Est-il possible de traiter d'un coup les suggestions pour plusieurs projets?

Oui, par le lien "Manage All Proofer's Suggestions" depuis la page principale du chef de projet.

Pourquoi est-ce important de définir des listes pour un projet?

Les listes de mots douteux permettent de diminuer le risque de scannos furtifs.

Les listes de mots corrects permettent de réduire le nombre de faux-positifs, c'est à dire de mots qui sont inutilement signalés à l'attention du relecteur: il est plus facile de repérer dans une page une erreur parmi un petit nombre de mots signalés, que parmi 30 mots signalés dont 29 sont corrects.

Pour cette raison il est recommandé de mettre à jour les listes de projets, y compris pour des projets ayant déjà effectué certains tours de relecture.

Que se passe-t-il si un mot est identifié à la fois comme correct et douteux?

Il est possible que des mots apparaissent en même temps dans une liste de mots corrects et une liste de mots douteux au même niveau de priorité (par exemple, un projet avec deux langues). Les mots douteux ont alors priorité sur les mots corrects. (Mais si le mot est également dans la liste de mots correct du projet, alors il est considéré comme correct, car les listes de projet ont priorité sur les listes globales du site.)

Que se passe-t-il en cas de langues multiples?

Les listes sont fusionnées. Par exemple dans un projet en français + anglais, le mot "do" sera considéré comme douteux (car il est dans la liste globale des mots douteux en français--scanno pour "de") à moins qu'il apparaisse dans la liste de mots corrects du projet.

Que deviennent les listes lors du clonage d'un projet?

Les listes de mots corrects et douteux sont copiées vers le nouveau projet dans l'état où elles sont au moment du clonage. Les suggestions des relecteurs ne sont pas clonées.

Qu'est-ce qu'un mot pour WordCheck?

un "mot" est une séquence maximale de lettres (avec ou sans accents), chiffres, apostrophes. De plus, les combinaisons utilisées pour représenter les ligatures (comme [oe]) ou les caractères diacritiques (comme [=a], pour ā), sont considérés comme des lettres. Ainsi, "c[oe]ur" est un mot.

L'apostrophe est particulière, elle n'entre dans un mot que quand elle est seule et entourée des deux côtés de chiffres/lettres. ainsi, "l'heure" est un mot, mais "'tis" est considéré comme une apostrophe suivie du mot "tis".

Évitez d'ajouter des caractères de ponctuation dans une liste: par exemple, "etc" dans la liste de mots corrects reconnaîtra "etc" et "etc."; mais ajouter "etc." dans la liste de mots corrects n'aura aucun effet dans la version actuelle de WordCheck, et ne reconnaîtra ni "etc" ni "etc."

Chantier.png Mettre à jour par rapport à la FAQ anglaise récente.

To comment or request edits to this page, please contact jjz or John_NZ.

Return to DP Official Documentation Menu