Vol.42 PLaMo翻訳リリースの背景
◆PLaMo翻訳のリリースと概要
先月リリースしたPLaMo翻訳についてのお話をさせてもらえたらと思います。
私たちは今PLaMoという言語モデルをフルスクラッチで作っていて、GENIACの第2期でPLaMo 2.0-31Bを作ると同時にいろんなサイズのモデルを作りました。
こういったモデルをイチから作っている利点としては、モデル自体もそうなんですが、モデルを作る過程で、データセットとか学習のインフラだとかそういったものを持っていて、それを使って基本となるようなモデルに対して、プロンプトチューニングや、簡単なファインチューニングでは実現できないような、抜本的な改良をして新しいモデルを作ることができます。
今LLMを作っている多くの会社が、コーディング向けや、エージェント向けを作ることを進めてますが、今回私たちは、テキスト翻訳機能に特化したPLaMo翻訳というモデルを作りました。
そして、PLaMo翻訳を専用サイトで無償リリースしたのと、年商10億円未満の企業・個人の方が自由に使えるようなモデルをHugging Faceで公開しまして、利用できるようになっています。
具体的な中身は後で順番に説明しますが、リリース直後から、かなりの引き合いがあり多くの方に使って頂いています。
◆LLMベースの翻訳の強みと従来の方法との違い
「翻訳ってもう枯れた技術で、今更なんで翻訳やるんだ」「無料の翻訳ツールが出てたり、それこそ他社製品、商用製品がある中で、今翻訳で新しくやることがあるのか」って言う方も多いです。
ですが、実際に利用してる人たちのケースで見ると、困ってたことができるようになった、というコメントも多くあります。

例えばこの方は、恐らくゲームか何かウェブサイトの中で使ってるスクリプトで、文字が入ってるようなデータがあったとして、左側のスクリプトをそのまま普通の翻訳ツールにかけちゃうと、JSONのコードが全部壊れちゃって、めちゃくちゃな翻訳になります。
一方で、PLaMo翻訳はLLMベースなので、LLMはJSONはもちろんよく理解していて、どこがコードに対応する部分で、どこが値の部分で、しかもその値の部分は、どこを日本語に翻訳すべきで、どこは翻訳しないか、みたいなことを考えてくれるので、その値の部分だけをちゃんと空気を読んで翻訳をしてくれる。
こういうことは今までの翻訳ツールではできなかったことです。こういう使い方は一例で、他にも結構たくさん利用例が増えています。

わかりやすい翻訳の難しい例で、日本語で「お花を摘みに行ってきます」って言うと、これはトイレに行くことなんですけれども、ちゃんと「レストルームを使わせてください」っていう英語にします。
他のツールは日本語のこういうことを知らない、もしくは知っていてもいつ使って大丈夫かわからないので、直訳の「I’m going to pick some flowers」って翻訳するわけですね。
そもそもなんで翻訳がこれだけ強いかって言うと、翻訳って結局は「言語の知識をどれだけ持っているか」「言語の裏側にある知識をどれだけ持っているか」というところが重要で、それで言うと大規模言語モデル(LLM)がとても強力です。
普通の翻訳ツールではありえないような、とんでもない量の言語データを読んでいて、例えばPLaMoの場合は特に日本語データをたくさん読んでいますので、膨大な量の言語知識をそもそも持っていると。
翻訳に関しては、日本語から英語、英語から日本語みたいな、いわゆる対訳文みたいなものがたくさんないと、「この場合はどうやって翻訳したらいいのか」というのがわからない。
そういったものも、LLMは従来の翻訳アプローチと比べて、はるかに少ない学習量で対訳能力を獲得することができることが分かっています。
◆今後の展望と課題
今、PLaMo翻訳を専用サイトで、和英・英和は5,000文字制限で出しています。今後の利用状況を見ながら、「こういう使い方をしてくれているユーザーが多いな」とか、「こういう使い方したい」っていうニーズを踏まえた上で、使える機能を増やしたり、完成度を上げて事業化をしていく準備を今進めています。
PLaMoは既にいろいろな課題がわかっています。例えば把握している現在の課題を説明しますと、1つは、すごい長い文を入れると途中をサボっちゃうみたいなことがあります。
例えば、論文丸ごと6万文字くらいを翻訳させようとすると、途中をサボっちゃったりするんですけれど、それって例えば、契約書丸ごと翻訳させようとしてる人が使って、重要な一文が抜けていたらとんでもないことになっちゃいます。
なので、そういった文書を翻訳した時も、翻訳前後で「正しく欠落なく翻訳されているか」を保証する仕組みを入れるのは必要で、これはモデル自体いじってもできるし、モデルをいじらなくても、入力や出力を工夫する、他の検証を加えるなど、いろんなやり方でできるだろうとは思います。
あと要望が多いのは、文章でもオフィスファイルとかGoogle Docsとかに入れても動くようにしてほしいというのもあります。地味だけれどクリティカルな機能追加は、色々やっていかないといけない。
あとは、プログラムの中とか設定ファイルとか、HTML丸ごと渡してそのまま翻訳したり、もうちょっと構造化されたような文章を翻訳してくれるものは可能性があって面白いなと思ってます。

