# よくある質問 FAQ

# CATツールについて

# CATツールってなに?

CATツールとはComputer Assisted Translation Toolのことで、日本語では翻訳支援ツールとも呼ばれます。人間が翻訳をしていく上で手間がかかりがちな既存訳の参照や用語・数字の確認、同じ文言の自動翻訳などが主な機能です。

# 機械翻訳とCATツールは違うの?

機械翻訳は翻訳エンジンを通して、コンピュータが訳文そのものをアウトプットしてくれます。 一方、CATツールでは翻訳をするのはあくまで人間です。コンピューターは事前に登録された既存訳の中から似ている文言や、参照すべき用語を提示します。そのため、既存訳や用語の蓄積がない場合は、一からの翻訳となります。 ただ、最近では機械翻訳との連携も強化されていて、既存訳と同時に機械翻訳の結果も参照できるツールが増えています。 CATOVISでもこうした機能を開発中です。

# 翻訳メモリってなに?

翻訳メモリとは、これまで訳したものを原文、訳文のペアで保存したものです。場合によっては、「メモ」「更新日時」「作成者」「一つ前の文」といった付加情報も一緒に保管されます。 実務上は「メモリ」や「TM」とよく省略されます。 一般的にファイルは「tmx」という拡張子で保存されます。これはXML形式の一種で、国際的にも標準化されています。このうち原文・訳文に直接関わる部分として、以下のようなタグが並んでいます。

<tu>
	<tuv xml:lang="aaa">
        aaa語のテキスト
    </tuv>
    <tuv xml:lang="bbb">
        bbb語のテキスト
    </tuv>
    <tuv xml:lang="ccc">
        ccc語のテキスト
    </tuv>
    ...
</tu>

tuはTranslation Unitの略で、一つのセグメントを表しています。その中にあるtuvはTranslation Unit Valueのことです。多言語プロジェクトでも使えるよう、一つのセグメントに複数の値(Value)を内包できる設計になっています。 しかし、個人の翻訳者が一つのファイルを開く際に複数の言語を参照することはほとんどないでしょう。そのためCATOVISでは軽量化の観点から、tmxから一つの原文言語と一つの訳文言語のみを抽出して使用しています。

# 用語集(タームベース)ってなに?

タームベースとは、原文の用語と訳文の用語をセットにして保管しているものです。よく「TB」と略されます。 翻訳の際に、原文中に用語集に登録された用語があった場合、ヒントとして翻訳者に提示してくれます。

tmxと同様、「tbx」という標準化されたxml形式があり、そのタグ構成は次のとおりです。

<termEntry>
	<langSet xml:lang='aaa'>
		<tig>
			<term>aaa語の用語</term>
		</tig>
	</langSet>
	<langSet xml:lang='bbb'>
		<tig>
			<term>aaa語の用語</term>
		</tig>
	</langSet>
    	<langSet xml:lang='ccc'>
		<tig>
			<term>ccc語の用語</term>
		</tig>
	</langSet>
</termEntry>

termEntryが一つの用語のまとまりを示し、その中に複数言語の用語が入っています。

用語集も翻訳メモリと同様、CATOVISでは一つのペアのみを読み込むようにしています。

# ロケールってなに?

様々なOSやアプリケーションが、使用する言語を区別するための設定のことです。

上述の翻訳メモリってなに?用語集(タームベース)ってなに?にあるとおり、これらのファイルは複数言語を内包しつつ、それを xml:lang という属性で区別するようになっています。これがロケールです。

ロケールの表記は原則として、ja-jp のように、言語+地域で構成されています。日本語だと分かりにくいですが、例えば英語の場合、en-usen-ukのようなロケールがあります。これを正しく設定しないと、CATOVISはTMX/TBXファイルを読み込むことができません。

ここでは読み込みたいTMXファイルのロケールを確認する手順の一例を紹介しておきます。基本的にはTBXファイルも同様の方法で、確認できます。

  1. メモ帳を使用してtmxファイルを開く
  2. xml:lang= を検索する
  3. 読み込みたい言語の直前にあるtuvタグ(TBXの場合はlangSetタグ)を探す
  4. そのタグにあるxml:langプロパティの値が読み込むべきロケールになる

# CATOVISの使い方について

# 起動しないんだけど?

CATOVISはその性質上、同時に2プロセス以上起動することができません。 起動前に何度もクリックすると、エラーが出て起動しなくなります。 1プロセス目のクリック後、しばらく待ってみてください。 また、CATOVISでは内部的に8686番ポートを使用しています。あまり見ないことではありますが、もし別のプロセスで8686番ポートを使用している場合は、そのプロセスのポートを変更するか、ご相談ください。

# アンイストールしたい

# CATOVIS本体

コントロールパネルの「プログラム」からアンインストールすることができます。

# Select.dotm

zipファイルに同梱のTemplateSetter.ps1を実行します(ダブルクリックではなく、右クリックして「PowerShellで実行」です)。ここで2を押せば、アンインストールされます。

# JSONってなに?

JSONとはJavaScript Object Notationのことで、その名のとおりJavaScriptで扱いやすいように設計されたファイル形式です。

Excelのような表組みだと、二次元以上の表現が難しい(AのBのCの値)のですが、JSON形式は階層の形で様々な情報を保持できます。

また、表組みほどではありませんが、一応人間読める形になっています。

以上の理由から、CATOVISではネイティブ形式としてCATツールのスタンダードであるTMXやTBXではなく、JSON形式を採用していますが、TMXやTBXについてももちろん読み書き可能です。

# その他

# 他のアプリとの連携について

Word以外のOfficeアプリケーション(Excel、PowerPoint)については、優先的に開発を進めています。 また、LibreOfficeやオンラインOfficeとも連携させたいと検討中です。 開発が待てない場合、CATOVISはWeb APIを介して操作できますので、ぜひ使ってみてください。

# 開発ロードマップ

  • Excelアドイン
  • PowerPointアドイン
  • オンラインOffice用アドイン
  • チェックモード
  • レビューモード
  • 機械翻訳連携