コラム

 公開日: 2015-06-01 

科学技術英語 1700万語のコーパス

サイト側のモバイル対応の有無を検索順位決定に使うGoogleの仕様変更や、サイト運営者によるSEO対策、機械翻訳コンテンツの急増などの諸々の要因で、近年Googleは翻訳者にとって次第に使いにくいものとなってきています。

ただ、だからといって「Google無し」では仕事にならないという人も多いでしょう。
特に英訳で語句や表現の確認用に使っている人たちしてみれば、昨今のGoogleの変化は相当にダメージになっているかと思います。

そこで・・・・。
Googleに変わるあるいは併用する補助手段として、科学技術文書コーパス「PERC Corpus Online」を使いこなせるようになっておくと良いかもしれません。

22分野の代表的な学術雑誌から集めた、約1700万語の膨大なコーパスデータ。
上手に活用すれば、いわゆるテクニカルタームの使用頻度や誤用、共起表現などを確認できるほか、一般語の表現チェックも可能です。

たとえば、非常に誤用の多いeffective toを調べてみましょう。
英英辞典によっては「effective in (doing) something」と明記した上で「Don't say 'this drug is effective to treat cancer'. Say it is effective in treating cancer'」という注意書きを添えているものもある(Longman Essential Activator)ほどなのですが、effective to~は、よく見かけます。

Googleで「ウェブ」ではなく「Books(書籍)」だけに限定して検索しても、effective toで相当数がヒットしますし、effective to treatやeffective to improveなども、かなりの数。
もはや、誤用というより「言葉は生き物」で市民権を得てしまったのではないかと思うほどですね。
(そして実際、そういう側面もなきにしもあらずなのかもしれません。)

一方、PERC Corpusでは、どうでしょうか。
effective toは、わずか8件。そのうち3件は、日本人によるもののようです。
コーパス:effective to
正しいeffective inが274件でしたから、これと比べると2桁違いますね。

検索結果の一覧で青字表示されている検索語(今回はeffective to)をクリックすると、分野のカテゴリ、サブカテゴリ、タイトル、著者名、国、ジャーナル名、ページ数、発行年などの書誌情報のほか、前後の文もフルに表示されます。

このコーパスには、名詞や動詞の活用形までまとめて検索できる基本形検索のほか、品詞検索、出現位置指定などの機能もあり、非常に便利です。
個人的には、かなり気に入って使ってきました。

分野を限定したいときは、検索画面右側の「サブコーパス」をクリックすれば、チェックボックスで指定が可能です。
対応しているのは、以下の22カテゴリです。

Agriculture
Biology
Chemistry
Civil Engineering
Computer Science
Construction & Building Technology
Earth Science
Electrical & Electronic Engineering
Engineering
Environmental Sciences
Fisheries
Food Science
Forestry
General Science
Materials Science
Mathematics
Medicine
Metallurgy & Metallurgical Engineering
Nuclear Science & Technology
Oceanography
Physics
Telecommunications

同じインタフェースで提供されている一般語のコーパス「BNC Online(1億語)」や「WordbanksOnline(1億語)」もあり、いちど使い方を覚えると、横断的に活用できるところも嬉しいです。
(BNCとWordbanksは1億語ずつということになっていますが、同じ語を検索しても結果が違うので、積んでいるデータは異なるはずです。)

詳しくは、小学館コーパスネットワークで。

関連記事

コーパス&共起表現リストを品質向上に活用する

この記事を書いたプロ

有限会社サグラーシェ

通訳・翻訳 水野麻子

東京都西東京市新町4-1-3-601 [地図]
TEL:0422-38-5035

  • 問い合わせ

このコラムを読んでよかったと思ったら、クリックしてください。

「よかった」ボタンをクリックして、あなたがいいと思ったコラムを評価しましょう。

5

こちらの関連するコラムもお読みください。

<< 前のコラム 次のコラム >>
最近投稿されたコラムを読む
著作・講演など

■著書・『語学力ゼロで8ヵ国語翻訳できるナゾ―どんなビジネスもこの考え方ならうまくいく』 (講談社 2010.2;現在6刷)・『大人のための「超手抜き」英語勉強法』...

メディア掲載
ジャパンタイムズ

Japan Times(2002/2/18)TRANSLATION AND INTERPRETATION(6面) 特許翻訳業界の現状と将来の展望に関する記事です。英日翻訳で10,000ワード/日(※)の処理速度や、方法...

 
このプロの紹介記事
特許翻訳のノウハウは自著などで公開。

9つの言語で特許翻訳を手がけた経験がある(1/3)

 特許翻訳のスペシャリストとして活躍中の水野麻子さん。この道22年のベテランです。玩具、食品、電気、機械、化学、最先端のバイオやITなど、手がける特許翻訳は多岐にわたります。かなり専門性の高い内容でも、その完成度が高い仕事ぶりが水野さんの強...

水野麻子プロに相談してみよう!

朝日新聞 マイベストプロ

完成度の高い特許翻訳をスピーディーに行う

会社名 : 有限会社サグラーシェ
住所 : 東京都西東京市新町4-1-3-601 [地図]
TEL : 0422-38-5035

プロへのお問い合わせ

マイベストプロを見たと言うとスムーズです

0422-38-5035

勧誘を目的とした営業行為の上記電話番号によるお問合せはお断りしております。

水野麻子(みずのあさこ)

有限会社サグラーシェ

アクセスマップ

このプロにメールで問い合わせる
プロのおすすめコラム
誤訳訂正制度があるから安心?

日本では、平成6年の改正特許法(7年7月1日施行)で外国語書面出願制度が導入されました。同時に、翻訳文の...

[ 特許明細書 ]

政府の権利 珍訳・迷訳の原因は?

ときどき、英文明細書の冒頭に「Government Rights」の記載がなされていることがあります。発明(の少なくとも一...

[ 特許明細書 ]

複数のWord/Excel文書をまとめてPDFに
イメージ

WordやExcelで作成した複数の文書ファイルを、一括でPDFに変換したいという需要はわりとあるようです。それも、...

[ 各種ソフトウェア ]

アスタミューゼを使った「誤訳」判断

「世界中の課題を解決し、未来を創る人のプラットフォーム」であることを掲げたastamuse(アスタミューゼ)という...

[ 訳語調べ&情報収集 ]

Weblioは、いつでも信頼できる?

Googleで検索したときに、一番上に英辞郎やWeblioのページが出てくる用語は、かなりの確率で間違っているか、間違...

[ オンライン辞書の誤訳集 ]

コラム一覧を見る

スマホで見る

モバイルQRコード このプロの紹介ページはスマートフォンでもご覧いただけます。 バーコード読み取り機能で、左の二次元バーコードを読み取ってください。

ページの先頭へ