AI・アノテーションにより作成できる「言語資産」
言語資産を作成することで「翻訳コストの削減」、「翻訳品質の安定化」、「生産性向上」が可能です。
また、言語資産を「機械翻訳エンジンのカスタマイズ」や「CMSへのデータ移行」にご利用いただくこともできます。
また、言語資産を「機械翻訳エンジンのカスタマイズ」や「CMSへのデータ移行」にご利用いただくこともできます。
AI・アノテーションとは
任意のデータに対して、関連する情報(メタデータ)を注釈として付与することをアノテーションといいます。翻訳されたコンテンツや資料データから、翻訳コストの削減・翻訳品質の安定化につながる、用途に応じた「使えるデータ」へ変換を行います。
用語集の作り方は用途によって違う?
用語集とは、「原文と訳文の用語が対になったデータ」であり、翻訳の際に活用することで専門用語や社内用語の統一ができ、品質を向上させることができます。しかしながら、ひとことに用語集と言っても、用途によってどのように作成すべきかは異なります。
人手の翻訳やポストエディットの場合
翻訳者が用語集を見ながら適用可否を判断できるため、用語に注釈をつけて作成することで、文脈に応じた訳し分けなどが可能となります。
機械翻訳の場合
用語集にある用語を機械的に置き換えることになるので、注釈などを不要で、原文と訳語のみのシンプルな形での作成が適しています。
自社で用語集を作成したいという場合
ブラウザ上で簡単安全に機械翻訳・ファイル翻訳ができる、機械翻訳活用ソリューション「XMAT®」の「LAC(Language Asset Creator)」機能を活用することで、誰でも簡単に用語集を作成する事も可能です。
インターネット上の多言語Webサイトから、独自の手法で効率的に対訳データを作成するサービスです。「CorpusNow」もご利用いただけます。
※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。
※上記は一例ですが、川村インターナショナルではお客様の用途に応じた用語集の作成が可能ですので、お気軽にお問い合わせください。
生成 AI を活用した翻訳プロセスの自動化・効率化
機械学習やディープラーニング、自然言語処理、画像処理、音声認識
これらの技術を組み合わせることで、翻訳に関するさまざまなタスクを自動化し、効率化することができます。
これらの技術を組み合わせることで、翻訳に関するさまざまなタスクを自動化し、効率化することができます。
用語集の作成・適用
用語集の作成・適用
文法校正・差分
OpenAI GPT4o/Claude3/Gemini1.5を活用し、英語文法の構成モデルを構築し、修正箇所を差分表示するツールを開発しました。
対応言語
| 東南アジア言語 | タイ語、ベトナム語、インドネシア語、マレー語、ミャンマー語、タガログ語、クメール語、ラオス語 |
|---|---|
| アジア・中東言語 | |
| アフリカ言語 | スワヒリ語、アフリカーンス語 |
| 南北アメリカ言語 | 英語(アメリカ)、スペイン語(ラテン)、仏語(カナダ)、ポルトガル語(ブラジル) |
| 西ヨーロッパ言語 | 英語(イギリス)、スペイン語、ポルトガル語、仏語、ドイツ語、オランダ語、ギリシャ語、イタリア語、マルタ語、ウェールズ語、アイスランド語、アイルランド語、カタルーニャ語 |
| 北ヨーロッパ言語 | ノルウェー語、スウェーデン語、デンマーク語、フィンランド語 |
| 東ヨーロッパ言語 | ロシア語、チェコ語、スロバキア語、スロベニア語、ブルガリア語、ポーランド語、ハンガリー語、ルーマニア語、ラトビア語、セルビア語、エストニア語、リトアニア語、クロアチア語、ウクライナ語、ジョージア語、ベラルーシ語 |
活用事例
多言語マニュアルの翻訳コスト削減のため、翻訳済みマニュアルから翻訳メモリを作成したい
お客様:制御機器メーカー
悩 み:翻訳済みマニュアルの量が膨大なため、従来の方法で翻訳メモリを作成すると期間とコストがかかりすぎる
言 語:日本語-英語、日本語-中国語(簡体字、繫体字)、日本語-韓国語
悩 み:翻訳済みマニュアルの量が膨大なため、従来の方法で翻訳メモリを作成すると期間とコストがかかりすぎる
言 語:日本語-英語、日本語-中国語(簡体字、繫体字)、日本語-韓国語
川村インターナショナルが自社開発したツールにより、対訳データを作成。そのデータをもとに当社の経験豊富な担当者が翻訳メモリを作成。
結果
手動で作成する場合と比較して、コスト58%減、納期も3割程度短縮。
| お客様の声:他社様と比べた際に、かなり安価で納期も短かったので、安かろう悪かろうだったらどうしようか心配はありました。しかしながら、結果として仕上がりに全く問題なく、大変満足しております。 |
※価格・納期の削減率は案件により異なります
LLM(大規模言語モデル)
LLMは、大規模なテキストデータを学習し、言語理解や生成に優れた性能を持つモデルのことを指します。LLMは、自然言語処理のタスクに特化しており、文章の生成、翻訳、要約、質問応答などのタスクを実行することができます。
- OpenAI社のGPT(Generative Pre-trained Transformer)シリーズ
- Anthropic社のClaudeシリーズ
- Google社のGemini
LLMのメリット
- 文脈を考慮する
- 汎用性が高い
- ファインチューニング/ゼロショット翻訳の実行ができる
- 文体、用語の指定など、翻訳以外の自然言語処理を付加しやすい
LLMのデメリット
- 構築・運用コストがとても高い(NMTの1000倍)
- 数百万を超すようなテキストの翻訳処理にはとても時間がかかる
- デフォルトでは再現性が考慮していない