機械翻訳とは、コンピューターを使用してテキストをある言語から別の言語に翻訳することです。何十年も前から存在していますが、よく知られるようになったのはつい最近のことです。 1990 年代に IBM などの企業が翻訳の精度を高めるために統計モデルを導入し、Google が多言語の知識を広くアクセスできるようにすることで統計モデルを普及させました。
大きな飛躍はニューラル機械翻訳 (NMT)。以前の方法とは異なり、NMT は単語の背後にある文脈と意味を深く掘り下げて、正確なだけでなく自然に聞こえる翻訳を作成します。この進歩により、企業は日常的な文書の処理、大きなテキストの要約が容易になり、時間を節約できるようになりました。
このガイドでは、NMT とは何なのかをさらに深く掘り下げ、その能力をワークフローに組み込むために使用できる最良のツールのいくつかを探ります。議論を始めましょう!
ニューラル機械翻訳とは何ですか?またどのように機能しますか?
ニューラル機械翻訳 (NMT) は、人工ニューラル ネットワーク、特に深層学習モデルを使用してテキストをある言語から別の言語に翻訳する機械翻訳のアプローチです。 NMT は非常に人気があり、機械翻訳の流暢さと精度の向上において有望な結果を示しています。
ニューラル機械翻訳システムの基本アーキテクチャは、エンコーダ/デコーダ フレームワークで構成されます。 仕組みは次のとおりです。
- エンコーダ:エンコーダ コンポーネントはソース言語の入力文を受け取り、それを単語ごとまたはサブワード単位で処理します。 各単語または単位は、エンベディングとして知られる数値ベクトルとして表されます。 エンコーダーのタスクは、ソース文の意味論的および構文情報を取得し、それを「思考ベクトル」または「コンテキスト ベクトル」と呼ばれることが多い固定長ベクトル表現にエンコードすることです。 通常、リカレント ニューラル ネットワーク (RNN) またはトランスフォーマー モデルがエンコーダーとして使用されます。
- デコーダ:デコーダ コンポーネントは、エンコーダからエンコードされたベクトル表現を取得し、ターゲット言語で翻訳された文を生成します。 エンコーダーと同様に、デコーダーも RNN または Transformer モデルを使用します。 各ステップで、デコーダはターゲット言語の語彙にわたる確率分布を生成し、最も可能性の高い単語または単位を次の翻訳として選択します。 各ステップでのデコーダの出力は次のステップの入力としてフィードバックされ、逐次変換の生成が可能になります。
- トレーニング:ニューラル機械翻訳モデルは、ソース言語とターゲット言語で整列された文のコレクションである大規模な並列コーパスでトレーニングされます。 トレーニング中、モデルは、予測された翻訳とトレーニング データ内の参照翻訳の間の差異を最小限に抑えるように学習します。 このプロセスには、バックプロパゲーションや勾配降下法などの手法を使用したモデルのパラメーターの最適化が含まれます。
- アテンション メカニズム: NMT の重要なコンポーネントの 1 つはアテンション メカニズムです。 アテンションにより、モデルは翻訳中にソース文のさまざまな部分に焦点を当てることができ、長距離の依存関係を把握して翻訳品質を向上させることができます。 アテンション メカニズムは、ソース文内の単語に重みを割り当て、デコーダでの翻訳の各ステップにおける単語の重要性を示します。
- 推論:推論フェーズでは、トレーニングされた NMT モデルを使用して、新しい未確認の文を翻訳します。 エンコーダは入力文を処理し、デコーダは単語ごとまたは単位ごとに翻訳された出力を生成します。 デコード プロセスでは、ビーム検索またはその他の検索アルゴリズムを利用して、複数の翻訳の可能性を探索し、モデルの学習された確率に基づいて最も可能性の高い翻訳を選択します。
ニューラル機械翻訳は、以前のルールベースまたは統計的機械翻訳のアプローチに比べて大幅な改善を示しています。 言語のニュアンスや長期的な依存関係をより適切に処理し、より流暢で自然な響きの翻訳を生成できます。
ウェブサイトに機械翻訳ソフトウェアを使用する必要がありますか?
Web サイトに機械翻訳ソフトウェアを使用する必要がある理由はいくつかあります。 ニューラル翻訳ソフトウェアを使用する必要がある理由をいくつか紹介します。
- 精度:機械翻訳ソフトウェアは大幅な発展を遂げていますが、特に複雑な内容や微妙な内容の場合、依然として人間の翻訳と同じレベルの精度が得られない可能性があります。 ウェブサイトで正確かつ高品質の翻訳が必要な場合、特に重要な情報や顧客向けのコンテンツについては、プロによる人間による翻訳を選択する方が良い場合があります。
- 対象ユーザー: Web サイトが世界中のユーザーにサービスを提供しており、さまざまな言語の基本的な翻訳を提供する必要がある場合、機械翻訳は便利でコスト効率の高いオプションとなります。 言語的な間違いが発生する可能性はありますが、訪問者がコンテンツの大まかな意味を理解するのに役立ちます。
- ユーザー エクスペリエンス:機械によって翻訳されたコンテンツは、不自然またはロボットのように聞こえる場合があり、ユーザー エクスペリエンスに影響を与える可能性があります。 コンテンツの翻訳が不十分だと、ブランドに否定的な印象を与えたり、訪問者を混乱させたりする可能性があります。 Web サイトにとってシームレスでポジティブなユーザー エクスペリエンスを提供することが重要な場合は、人間による翻訳の方が良い選択となる可能性があります。
- 予算とリソース:機械翻訳ソフトウェアは、特に予算が限られている企業や、大量のコンテンツを処理する必要がある企業にとって、より手頃な価格のオプションとなる可能性があります。 応答時間が短縮され、基本的な翻訳ではコスト効率が高くなります。 ただし、メンテナンス、事後編集、品質管理には追加のリソースが必要になる場合があることに注意することが重要です。
- スケーラビリティ: Web サイトのコンテンツ量が継続的に増加している場合、機械翻訳ソフトウェアを使用すると、スケーラビリティが容易になります。 人間による翻訳時間を待ったり、新しいコンテンツの起動に遅れを経験したりすることなく、新しいコンテンツを迅速に翻訳して更新できます。
- 一貫性:機械翻訳は、翻訳されたコンテンツに高レベルの一貫性を提供できます。 ユーザー ガイド、ポリシー、説明書など、一貫して翻訳する必要があるコンテンツがある場合、機械翻訳ソフトウェアを使用すると、同じ用語やフレーズが Web サイト全体で一貫して翻訳されるようになります。
- 時間の節約:機械翻訳ソフトウェアを使用すると、翻訳プロセスの時間を節約できます。 人間の翻訳者の応答時間を待ったり、翻訳をスケジュールしたりする必要はありません。 コンテンツをすばやく翻訳し、即座に結果を得ることができます。
- 自動更新:機械翻訳ソフトウェアは開発者によって頻繁に更新され、改良されます。 機械翻訳ソフトウェアを使用すると、手動でアップグレードしたり追加料金を支払ったりすることなく、これらのアップデートを自動的に利用できます。
- リアルタイム翻訳:一部の機械翻訳ソフトウェアはリアルタイム翻訳をサポートしており、Web サイトの訪問者はアクセス時にコンテンツを直接翻訳できます。 これにより、国際的なユーザー エクスペリエンスが向上し、訪問者がコンテンツをより深く理解できるようになります。
これらが、ニューラル機械翻訳ソフトウェアの使用を検討する理由のいくつかです。 次に、使用できるニューラル機械翻訳ソフトウェアのオプションについて説明します。
Web サイト向けの 6 つの最高のニューラル機械翻訳ソフトウェア
機械翻訳は、コンピューター ソフトウェアを使用して、あるソース言語から別のターゲット言語にテキストを翻訳し、物事を単純化します。 機械翻訳にはさまざまな種類があり、次のセクションで詳しく説明します。
Google 翻訳 AI
私たちは皆、人生のある時点で Google 翻訳を利用したことがあります。 資格のある翻訳者が不足しているため、何百万人もの個人がコミュニケーションをとっています。 Google 翻訳の最も優れた点は、通常、単語、文、または段落が正確かつ迅速に無料で翻訳されることです。 完全に正しいとは限りませんが、外国語の一般的な理解を提供します。
2006 年、Google 翻訳が開始されました。 当時は英語とアラビア語のみをサポートしていました。 それ以来、それは大幅に進歩し、多くの言語を翻訳できます! (100+)
Google 翻訳サイトのレポートによると、5 億人がこのサービスを利用しています。 一方で、サービス開始当初の利用者数は数百人。
「Google Translation AI」と呼ばれるものは、ブラウザの翻訳を使用する代わりに、Web サイトで使用する翻訳 API のプロフェッショナル バージョンです。 品質が大幅に向上します。 価格は 10 億文字あたり 20 ドルです。 現在、市場で最高のものとして知られており、 Linguise!
DeepL Pro 翻訳者
DeepLは、機械翻訳の新しい標準を設定します。 再帰型ニューラル ネットワークと単語ベクトルの形での単語表現に基づいているため、これまで人工的で機械的に聞こえる機械翻訳に慣れていました。 このため、多くの人は旅行中など、たまにしか Google 翻訳を利用しません。 DeepL は革命的です。 ニューラル ネットワーク ベースのアルゴリズムは、プロの翻訳者と実質的に同じ方法で資料を翻訳することができます。
深層学習は、多層の情報処理を使用するアルゴリズムの専門用語です。 「深い」という用語は、データが何層の変換を通過するかを表します。 このテクノロジーは、自動運転車、バーチャル リアリティ ヘッドセット、顔認識ソフトウェアによって強化されています。 そして今、DeepL はそれを翻訳に利用しています。
価格と翻訳品質は Google に似ていますが、利用できる言語はより限られています。
ビジネス向け Microsoft 翻訳者
Microsoft Translator for businessを使用すると、お客様とお客様のクライアントは、テスト シナリオから本格的な国際展開に迅速かつ簡単に拡張し、特定の業界用語に準拠するように翻訳を簡単に調整できます。
Microsoft 言語翻訳者には、他の大多数の翻訳ソフトウェアとは異なり、フレーズブックが含まれています。 旅行、食事、危機、健康、テクノロジーに関連する問題で最も広く使用されている表現が含まれています。 フレーズブックは非常に包括的ではありませんが、それでも言語の学習に興味がある人にとっては便利なオプションです。
発音や言語理解力を向上させたい場合は、すべての翻訳を聞くこともできます。
Microsoft Translator は 70 を超える言語をサポートしています。 ただし、すべての機能が 70 を超える言語で提供されているわけではありません。 マイクロソフトの翻訳ツールは、ドキュメント翻訳、チャット翻訳でよりグローバルであり、価格は 10 億文字あたり 10 ドル (Google の半分) ですが、品質と言語数が違いを生みます.
SYSTRAN 翻訳 PRO
SYSTRAN Translate Proと呼ばれるプロの翻訳プログラムは、クラウドベースです。 テキスト、ドキュメント (Word、PDF、PP など)、および Web ページを 55 以上の異なる言語と 140 の異なる言語の組み合わせに翻訳できます。 SYSTRAN は、業界やビジネスに適した素材を翻訳するためのローカル翻訳用の業界固有の翻訳モデルを提供します。
SYSTRAN Translate Pro を使用しても安全です。 基本的な翻訳では、編集はほとんどまたはまったく必要ありません。 一部の技術分野は、何年にもわたる研究開発とほとんど改訂の恩恵を受けていません。 このプログラムを使用すると、元のドキュメントの言語を自動的に識別しながら、ドキュメント全体をすべての一般的な形式で効率的に翻訳できます。 SYSTRAN は、ファイルや直接のテキスト入力に加えて、Web サイトのテキストや写真でさえ、データベースに細心の注意を払ってカタログ化された数十の言語に翻訳できます。 特別に作成された辞書を使用すると、これらの機能を改善し、特定の状況に合わせて調整できます。
価格は Google に匹敵し、利用できる言語も膨大です。 SYSTRAN Translate PRO の興味深い点は、自動ホスト バージョンを提供していることです。
AWS での Amazon Translate
Amazon Translate は、そのニューラル機械翻訳技術を使用して、競合他社を下回る精度を迅速に提供しますが、費用対効果が高いです!
従来の統計的およびルールベースの翻訳アルゴリズムとは対照的に、ニューラル機械翻訳はディープ ラーニング モデルを使用して、より正確な翻訳を提供し、より人間らしく聞こえるようにします。 Amazon Translate で大量のテキストを分析用に簡単に翻訳し、ウェブサイトやアプリケーションなどのコンテンツを多言語ユーザー向けにローカライズし、ユーザー間の言語間会話を効果的に促進できます。
常に改善されている Amazon Translate は、今後数年間で監視する必要があります。
ModernMT 機械翻訳
MMTは、カスタマイズされた文脈認識型の機械翻訳ソリューションであり、翻訳手順の進行に合わせてポスト エディットと翻訳メモリから知識を取得します。 その独特のアーキテクチャにより、リアルタイムでコンテンツに適応し、翻訳者タイプとして状況依存の MT 提案を提供できます。
また、セットアップや初期トレーニングも必要ありません。 代わりに、翻訳メモリと修正によって新しい情報を迅速かつ簡単に取得します。 MMT は、入力資料から学習して調整することにより、迅速で正確な翻訳プロセスを保証します。
ホライズン 2020 (2015–2017) の下での 3 年間のモダン MT イノベーション アクションは、完全に自動化された翻訳制作のコンテキストで、またインタラクティブなポストエディット シナリオのバックエンドとして使用するための、革新的なオープンソースの機械翻訳テクノロジを作成することを目的としています。
逆翻訳
Reverso は、18 の異なる言語での翻訳に対応できる無料の AI 翻訳ツールです。 Reverso 内では、テキストを入力するか、単語を口頭で表現するだけで、必要な翻訳が得られます。
Reverso は、翻訳機能に加えて、言語能力を向上させ、語彙を広げたいユーザーにとって貴重なリソースとしても機能します。 翻訳されたテキストは、関連する例や説明によって補完され、ユーザーがライティング、スピーキング、リーディングのスキルをさらに磨くための環境を促進します。
Reverso の主な機能には、文書の翻訳、文脈内の例の利用、発音ガイド、フラッシュカードへのアクセス、検索履歴の確認、語彙リストの編集などがあります。
クラウディン
Crowdin は、企業と個人の両方が幅広いコンテンツをさまざまな言語に翻訳できるように設計された翻訳およびローカリゼーション管理プラットフォームです。 このプラットフォームは、翻訳プロセスを簡素化することを目的としたさまざまなツールと表示オプションのセットを提供します。
Crowdin はニッチな機械翻訳ツールではありません。 むしろ、チームメンバー全員がアクセスできるタスク管理、支払い処理、共同作業機能などの包括的な機能が含まれています。 その結果、Crowdin はプロジェクトの実現予測を改善し、チーム内のコミュニケーションを強化します。
Crowdin の主な機能は、翻訳タスクの委任、用語集の統合、内蔵翻訳メモリ、カスタマイズ可能な翻訳メモリ、翻訳プロジェクト管理です。 クラウドの価格は 50 ドルから。
最高のニューラル機械翻訳ソフトウェアのコスト比較表
それぞれの最高のニューラル機械翻訳ソフトウェアを理解した後、今回はこれらの各ソフトウェア間の比較表を提供します。 ここではその一部を紹介します。
ツール | 価格 |
---|---|
Google 翻訳 AI | 10 億文字あたり 20 ドル |
ディープL | $8,74 / 月 (言語によって異なります) |
マイクロソフト翻訳者 | 10 億文字あたり 10 ドル |
SYSTRAN翻訳プロ | $5.41 / 月 |
アマゾン翻訳 | 15 ドル / 100 万文字 |
ModernMT機械翻訳 | 8ドル/100万文字から開始 |
レベルソ翻訳 | $7,03 / 月 |
クラウディン | $50/月 |
Linguise : ニューラル機械翻訳ソフトウェアの代替ソリューション
上記の NMT 推奨事項に加えて、これらのツールの 1 つであるLinguise。Linguise翻訳では主に Google ソリューションが使用されていますが、特定の Web サイトの HTML コンテンツをすべて翻訳するために多くの改良が加えられています。さらに、すべての顧客が必要とする翻訳量が多いため、大規模な Web サイトであっても、手頃な価格でご利用いただけます。
Linguiseは SaaS として翻訳を行っており、Web サイトの自動翻訳の設定を支援することを目的としています。 WordPress 、 Drupal 、 Magento 、 OpenCart 、または任意のカスタム セットアップなどの PHP ベースの Web サイトは Linguiseと統合。 Linguiseを超える言語が機能し始めます。
Linguise言語に合わせて最大 98% の完璧な翻訳品質を提供します。 各言語は、言語ペアに応じて異なる性質を持っています。 Linguiseの品質について詳しくは、次の表を参照してください。
NMT翻訳 | 人間による翻訳 | 品質 | |
英語スペイン語 | 5,428 | 5,550 | 97% |
英語フランス語 | 5,295 | 5,496 | 96% |
英語-中国語 | 4,594 | 4,987 | 92% |
スペイン語-英語 | 5,187 | 5,372 | 96% |
フランス語-英語 | 5,343 | 5,404 | 98% |
中国語-英語 | 4,263 | 4,636 | 92% |
Linguiseでは、自動翻訳は機械翻訳テクノロジーの力を利用して Web サイトのコンテンツを翻訳します。
Linguise、翻訳が必要な Web サイトの HTML コンテンツをスキャンして特定します。 これには、テキスト要素、タイトル、説明、その他の関連コンポーネントが含まれます。
ユーザーが Web サイトにアクセスして特定の言語のコンテンツをリクエストすると、 Linguise翻訳リクエストを受け取り、特定されたコンテンツを自動的に翻訳します。 識別されたコンテンツは、処理のために翻訳エンジンに送信されます。
Linguiseさらなる改善と調整を行うことで、機械翻訳されたコンテンツをさらに改善し、より良い品質と文脈上適切な翻訳を保証します。 これには、翻訳されたテキストを Web サイト固有のトーン、スタイル、要件に適合させることが含まれます。
改善された翻訳は Web サイトに送り返され、要求された言語でユーザーに表示されます。 翻訳されたコンテンツは、Web サイト上の元のコンテンツをシームレスに置き換えます。
Linguiseでニューラル機械翻訳を使用できるようにするには、次のいくつかの簡単な手順を開始する必要があります。 Linguiseで Web サイトのドメインを追加することから始めて、表示される言語をいくつか選択します。
次に、ダッシュボードから API キーをコピーし、次のように CMS ダッシュボードWordPressなど) に貼り付けます。
その後、Web サイトに表示されるLinguiseダッシュボードで言語スイッチャーを設定します。
その場合は、 Linguiseを使用して Web サイトの自動翻訳を開始できます。
ここでは、 Linguiseを使用した Web サイトの翻訳について見ていきます。
Linguise自動翻訳を使用する利点
Linguise使用すると得られる利点をいくつか紹介します。
- より広いリーチ:あなたがウェブサイトの所有者である場合、あなたが通常書いている国以外の読者があなたのコンテンツを利用できるようにすることを検討していることを知っています. 世界中に拡大したり、主要な地域以外の特定の地域に焦点を合わせたりして、追加の視聴者にリーチしたい場合は、 Linguise。
- 良い SEO ランキング:世界中の何人かの人々が、あなたのウェブサイトとそのコンテンツに信頼を寄せています。 言語の壁なしで多くの国の消費者をさらにターゲットにすることができれば、トラフィック、リード、および売上を増やすことができます. 競争が少ないため、競合他社よりも間違いなくあなたのウェブサイトを支持し、国際的な SEO ランクを上げます。
- カスタマイズされた翻訳: Linguiseは、Google の有名な NMT モデルを利用して、資料が可能な限り正確に翻訳されるようにします。 さらに、翻訳が改善された可能性があると思われる場合は、ウェブサイトのフロント エンドから翻訳をカスタマイズできます。
- 時間の経過とともに強化される: Linguiseは、翻訳するコンテンツのコンテキストを認識し、関連性を確立し、ニューラル機械学習を使用して翻訳する単語ごとに改善します。
- コンテンツの排他性:アカウントで高度な翻訳ルールを設定して、コンテンツを置き換えて翻訳から除外する状況を指定することもできます。 たとえば、テキストケース、HTML コンポーネント、URL、および言語を、翻訳されるコンテンツに含めたり除外したりできます。
結論
多くの機械翻訳ソフトウェアと API が市場に出回っていますが、市場を共有しているリーダーはほとんどいません。 彼らのデータと APILinguiseを使用することは、Web サイトに実装するのに適切なソリューションのようです。
自動即時ニューラル翻訳は、世界最大の企業の一部で採用されています。 現在、 Linguiseは、手動の翻訳サービスよりもはるかに安価な迅速で安価なソリューションを提供しており、これらの利点を中小企業が利用できるようにしています。