デジタル校正の覚え書き【旧版】

この文書は、1998〜1999年ごろに作成したものです。以来ほとんど加筆訂正をしていないため、内容が現状にそぐわなくなっている箇所もあります。何卒ご容赦くださいますようお願い申しあげます。



4. デジタルテキストの誤植 傾向と対策

デジタルテキストの誤植といっても、デジタルならではのものもあれば、そうでないものもあります。また、入力の方法が違えば誤植の傾向もまた違ってきます。とりあえず、気がついたこと、気になったことを書き留めはじめました。

まあ、傾向と対策とかいって、まるで参考書みたいなタイトルをかかげてしまってますが、実際の内容は、要するに当方の個人的な備忘録のようなものです。いずれきちんとまとめられればよいなあ、と思ってはいるのですが、現時点ではただただずらずらと列挙してあるだけですので、あしからず。

同音異義語、同訓意義語などの誤変換

上の見出しにさっそく変換ミスがあるのにお気づきの方も多いと思います。もちろんわざとです。というか、見出し部分を入力し終えて HTML のタグを入れてるときに「あれ?」と気づいて、「おお、ちょうどいいじゃん」とか思って、誤変換をあえてそのまま残しておくことにしただけです。

なんてことはさておき、わざわざ申し上げるまでもなく、キーボードからマニュアル入力されたテキストには、こういった誤変換がつきものです。こんなわかりきったこと、と誰しもが思うわけですが、わかってはいても変換ミスにはなかなか気づきにくいこともある。それはそれでしょーがないわけですが、校正する場合はしょーがないだけでは済まされない。

そこで対策。音読みすべき語は訓で読んでみる。訓読みすべき語は音で読んでみる。音とか訓とかがよくわからなければ、その文字を使った違う言葉を思い浮かべてみる。上の見出しを例にとると、「同訓意義語」を5文字まとめて「ドウクンイギゴ」と真っ当に読むのではなく、1字1字にバラして例えば次のように読んでみる――

同……おな(じ)
訓……“訓辞”の“クン”
意……“意味”の“イ”
義……よし
語……かた(る)

――そうすると、「え? “意味”の“イ”? そりゃおかしいや」てな具合に引っかかってくれたりするものです。いちいちこれをやるのはひどくまどろっこしいかもしれませんが、校正初心者の基本である「1字1字の引き合わせ」を徹底的に叩き込むためのよい練習にもなって一石二鳥なのでは、と。うーん、たいへんだー。でも私はなるべくそうやってます。うーん、えらいなー。それでも見落としをやらかしちゃったりはしますが。うーん、まだまだだなー。


似た形の文宇の誤認識

また見出しに誤宇を入れてしまいました。という一文の中にもやっぱり誤宇が。(←しつこい)

OCR ソフトを使って作成されたテキストに頻出する誤植がこのタイプ。むろん、原稿なり底本なりを見ながらマニュアル入力する場合にも似た形の別の文字と見間違えて入力しちゃうこともありますが、その頻度は OCR モノに比すればかなり低いでしょう。ともかく、OCR ソフトによる誤認識はなかなかやっかいだなあ、というのが偽らざる実感です。

これはもう、あらかじめ誤認識されやすい文字を念頭に置きながら引き合わせをし、危なっかしい文字が出てきたら「おっと、これは要注意だ!」といちいち警戒するしかないような。どういう文字が危なっかしいのかというと、例えば『校正必携』(日本エディタースクール刊)には「誤りやすい漢字の例」と称する一覧が載っているので、それを眺めれば「あー、なるほど、たしかに“字”と“宇”は似てるわ」ということはわかります。わかるんですが、それを丸暗記してもしょうがないというか、労が多いわりにはあまり報われないというか。ミもフタもない言い方になりますが、「誤りやすい漢字の例」を念頭に置きつつ、実際に経験を積みながら自分なりの「危なっかしい文字リスト」を蓄積していくのがいちばん確実な方法かと思われます。しかし、ミもフタもないままではちょっと申し訳ないので、私の頭の中に形成されつつある誤認識されやすい文字リストをアップしてみました。ただし未完成品です。というか、完成することはないでしょう。


その他

対象は本文のみにあらず

タイトル、著者名、見出し、ルビ、クレジット、……本文以外のこれらのものどもも、もちろん校正の対象です。見出しや章番号などは文字列が短かったり文字が大きかったり太かったりするので、つい気がゆるんで大ざっぱにまとめて読んでしまいそうになりますが、本文以外の文字列も1字1字たんねんに引き合わせるよう心がけています。




校正部屋 > デジタル校正の覚え書き【旧版】4. デジタルテキストの誤植 傾向と対策
<http://www.planaria.org/prr/ver1/04_tips.html>
Copyleft: <kat@planaria.org>