AI・アノテーションにより作成できる「言語資産」
また、言語資産を「機械翻訳エンジンのカスタマイズ」や「CMSへのデータ移行」にご利用いただくこともできます。
AI・アノテーションとは
こんな方におすすめのサービスです
- 紙文書、Webサイトなど、さまざまな形式のデータを使えるデータに変換したい
- 翻訳コスト削減のために言語資産を作成したいが、予算も限られている
- 翻訳やポストエディットの工数削減のため、用語集や翻訳メモリを整備したい
- 機械翻訳エンジンを自社用にカスタマイズして、訳文品質の精度を向上させたい
- 具体的に何をしたらいいかわからないが、手持ちのデータを有効活用したい
用語集の作り方は用途によって違う?
人手の翻訳やポストエディットの場合
機械翻訳の場合
自社で用語集を作成したいという場合
インターネット上の多言語Webサイトから、独自の手法で効率的に対訳データを作成するサービスです。「CorpusNow」もご利用いただけます。
※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。
【資料】用語集・翻訳メモリから見るAI・アノテーションの活用方法
・翻訳会社が行うAI・アノテーションとは?
・用語集から見るAI・アノテーションのメリット
・翻訳メモリから見るAI・アノテーションのメリット
問い合わせをする前にまずは資料を。という方はお気軽にご請求ください。
あらかじめご了承の程よろしくお願い申し上げます。
活用事例
多言語マニュアルの翻訳コスト削減のため、翻訳済みマニュアルから翻訳メモリを作成したい
悩 み:翻訳済みマニュアルの量が膨大なため、従来の方法で翻訳メモリを作成すると期間とコストがかかりすぎる
言 語:日本語-英語、日本語-中国語(簡体字、繫体字)、日本語-韓国語
| お客様の声:他社様と比べた際に、かなり安価で納期も短かったので、安かろう悪かろうだったらどうしようか心配はありました。しかしながら、結果として仕上がりに全く問題なく、大変満足しております。 |
技術資料の翻訳に機械翻訳を利用しており、ポストエディットの工数を減らしたい
悩 み:汎用的な機械翻訳エンジンの訳文品質がイマイチで、専門用語・社内用語の訳出などに不満がある
言 語:日本語-英語
| お客様の声:訳文の修正にかかる工数を平均して15%ほど削減でき、ドキュメントによってはほとんど修正なしで使えるようになりました。非常に大変助かっています。 |
よくある質問
テキスト抽出やファイル変換とは具体的にどのようなサービスですか?
テキスト抽出では、紙原稿やScanデータのテキスト化、また動画や録音データの音声をテキスト化することが可能です。また、ファイル変換では、WordファイルをHTMLやXMLにしたい等、あるデータを別のデータに変換することが可能です。いずれも一部工程を自動化して効率的に処理することで、コストや納期を抑えることができます。
また、ここに記載している以外にもテキスト化したデータをラベリング・分類したり、テキストマイニングしたりと、お客様のニーズに応じたサービスの提供も可能です。翻訳会社のAI・アノテーション 活用例集はこちら。詳しくは当社までお問い合わせください。
翻訳メモリとはなんですか?
自社の保有する翻訳されたテキストのデータを、原文と翻訳文を一対としてデータベース化したものです。このデータを再利用することで翻訳にかかる費用を低減することができます。当社では手動で作成する他、ツールを活用して翻訳メモリを作成することも可能です。詳しくはCorpusNowのサービスページをご覧ください。
また、自社で作成したいという場合には、弊社の機械翻訳活用ソリューション「XMAT®」の「LAC(Language Asset Creator)」機能をご利用ください。
対訳データを作成するには、どのくらいの量のテキストデータが必要ですか。
現在主流となっているニューラル機械翻訳では、おおむね1万ペア未満の対訳データを学習させると、訳文の品質が低下することが多いです。ただし、弊社が提供している「みんなの自動翻訳@KI」では、ニューラル機械翻訳と用例ベース機械翻訳のハイブリッドを使用しているため、対訳数が少なくても品質の低下がありません。
AI・アノテーションで作成した言語資産はどのように機械翻訳に活用できるのでしょうか。
対訳データ(コーパス)は機械翻訳エンジンのカスタマイズに使用し、訳調を学習させることができます。用語集は機械翻訳する際に用語を自動的に置き換えることが可能です。