AI・アノテーションにより作成できる「言語資産」

言語資産を作成することで「翻訳コストの削減」、「翻訳品質の安定化」、「生産性向上」が可能です。
また、言語資産を「機械翻訳エンジンのカスタマイズ」や「CMSへのデータ移行」にご利用いただくこともできます。
AI・アノテーションとは
任意のデータに対して、関連する情報(メタデータ)を注釈として付与することをアノテーションといいます。翻訳されたコンテンツや資料データから、翻訳コストの削減・翻訳品質の安定化につながる、用途に応じた「使えるデータ」へ変換を行います。

AI・アノテーションのご利用の流れ

任意のデータに対して、関連する情報(メタデータ)を注釈として付与することをアノテーションといいます。翻訳されたコンテンツや資料データから、翻訳コストの削減・翻訳品質の安定化につながる、用途に応じた「使えるデータ」へ変換を行います。
L_ai_annotation_01_img_1l

元になるデータ 紙文書

L_ai_annotation_01_img_2l

元になるデータ Webサイト

L_ai_annotation_01_img_3
OCR
L_ai_annotation_01_img_4
Webクロール
L_ai_annotation_01_img_5
用語集 作成
L_ai_annotation_01_img_6
翻訳メモリ/対訳データ 作成
L_ai_annotation_01_img_7
テキスト抽出
L_ai_annotation_01_img_8
ファイル変換
L_ai_annotation_01_img_9
カスタマイズエンジンの作成
L_ai_annotation_01_img_10
DX(デジタルトランスフォーメーション)

用語集の作り方は用途によって違う?

用語集とは、「原文と訳文の用語が対になったデータ」であり、翻訳の際に活用することで専門用語や社内用語の統一ができ、品質を向上させることができます。しかしながら、ひとことに用語集と言っても、用途によってどのように作成すべきかは異なります。
人手の翻訳やポストエディットの場合
翻訳者が用語集を見ながら適用可否を判断できるため、用語に注釈をつけて作成することで、文脈に応じた訳し分けなどが可能となります。
機械翻訳の場合
用語集にある用語を機械的に置き換えることになるので、注釈などを不要で、原文と訳語のみのシンプルな形での作成が適しています。
自社で用語集を作成したいという場合
ブラウザ上で簡単安全に機械翻訳・ファイル翻訳ができる、機械翻訳活用ソリューション「XMAT®」の「LAC(Language Asset Creator)」機能を活用することで、誰でも簡単に用語集を作成する事も可能です。

インターネット上の多言語Webサイトから、独自の手法で効率的に対訳データを作成するサービスです。CorpusNow」もご利用いただけます。

※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。

※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。
※上記は一例ですが、川村インターナショナルではお客様の用途に応じた用語集の作成が可能ですので、お気軽にお問い合わせください。

生成 AI を活用した翻訳プロセスの自動化・効率化

機械学習やディープラーニング、自然言語処理、画像処理、音声認識
これらの技術を組み合わせることで、翻訳に関するさまざまなタスクを自動化し、効率化することができます。

用語集の作成・適用

用語集の作成・適用

文法校正・差分

OpenAI GPT4o/Claude3/Gemini1.5を活用し、英語文法の構成モデルを構築し、修正箇所を差分表示するツールを開発しました。
L_explanation_02-1

L_explanation_02-1

L_explanation_02-3

活用事例

usage_ex_1

多言語マニュアルの翻訳コスト削減のため、翻訳済みマニュアルから翻訳メモリを作成したい

お客様:制御機器メーカー
悩 み:翻訳済みマニュアルの量が膨大なため、従来の方法で翻訳メモリを作成すると期間とコストがかかりすぎる
言 語:日本語-英語、日本語-中国語(簡体字、繫体字)、日本語-韓国語
川村インターナショナルが自社開発したツールにより、対訳データを作成。そのデータをもとに当社の経験豊富な担当者が翻訳メモリを作成。
結果
手動で作成する場合と比較して、コスト58%減、納期も3割程度短縮。
お客様の声:他社様と比べた際に、かなり安価で納期も短かったので、安かろう悪かろうだったらどうしようか心配はありました。しかしながら、結果として仕上がりに全く問題なく、大変満足しております。
 
※価格・納期の削減率は案件により異なります
LLM_img1
LLM(大規模言語モデル)
LLMは、大規模なテキストデータを学習し、言語理解や生成に優れた性能を持つモデルのことを指します。LLMは、自然言語処理のタスクに特化しており、文章の生成、翻訳、要約、質問応答などのタスクを実行することができます。

  • OpenAI社のGPT(Generative Pre-trained Transformer)シリーズ
  • Anthropic社のClaudeシリーズ
  • Google社のGemini
LLMのメリット
  • 文脈を考慮する
  • 汎用性が高い
  • ファインチューニング/ゼロショット翻訳の実行ができる
  • 文体、用語の指定など、翻訳以外の自然言語処理を付加しやすい
LLMのデメリット
  • 構築・運用コストがとても高い(NMTの1000倍)
  • 数百万を超すようなテキストの翻訳処理にはとても時間がかかる
  • デフォルトでは再現性が考慮していない

お問い合わせ

当社との協業のお申し込み、またはお問い合わせがございましたらお気軽にお問い合わせください。