Preferred Networks

Vol.58 OpenRouterの分析データからみるLLM利用の現状とトレンド

◆100兆トークンから読み解く利用実態

今のLLMが「どういったところに利用されてるのか」というのを調査した結果レポートについて話します。

これは何かって言うと、今LLMが色々使われている中で、みんなが「何に使ってんのかな」とか、「どういったモデルが使われてるのか」っていうのが分析されたものです。

OpenRouter(オープンルーター)という、多分世界で一番使われているLLMのルーティングサービスがあるんですけど、そこがいろんなオープンモデルのAPIとか、商用のAPIをルーティングしていて、この1年か2年間の分析結果を公開しています。

分析に使われたトークン数は100兆トークンで、トークン内容は見ないけれども、APIを叩く時に使われたメタデータ(タイミング、モデル、プロバイダー、ストリーミングなど)と、一部のデータを抜粋してラベル付けして、「このメタデータだったらこの人はきっとキャラクター生成に使ってるだろう」とか、「この使い方だったらコーディングに使ってるだろう」という分類モデルを作って解析しています。

◆オープンモデルとクローズドモデルの利用比率と変遷

まずオープンモデルとクローズドモデルを比較します。

一番左の2024年から見るとずっと変わっていなくて7割がクローズド、OpenAIとかAnthropicとか、そういったモデルが使われていて、3割がオープンなモデルが使われています。

一方で、オープンモデルの中身は傾向にかなり違いがあって、まず2024年の終わりにDeepSeek(ディープシーク)ショックがありました。

それより前はほぼLlamaとかが中心だったんですが、ここでLlamaがほぼいなくなって、DeepSeekが支配的になりました。この時にDeepSeekが何に使われていたかと言うと、ほぼ全てキャラクター向け、キャラクターと会話するような用途に使われていました。

そこから、中国発のオープンモデルQwenだとか、強いものがどんどん出てきていた中で、今年の夏ぐらいにかなり大きい変化がありました。

Kimi K2とかQwen、あとはMiniMaxだとか、中国の強いオープンモデルが立て続けに出たっていうのと、GPT OSSが出ました

今までほぼ占めていたDeepSeekが消えて、他のこれらが同じぐらいの割合を使うという風に変化がこの夏に起きています。

◆モデルサイズと利用用途の傾向

主なモデルの利用量ですが、今までずっとDeepSeekが前半ほぼ独占していたので、総トークン数で言うと14兆トークンとか多いですが、こんな感じで分散しています。

オープンモデルの中での利用割合で言うと、夏までが青色のDeepSeekがほぼ支配的になっていたのが、夏の様々なモデルが登場して以降にガクっと減って(それでも2割ぐらい占めてます)、他がMiniMax、Qwen、あとはGPT OSSみたいのが1割2割の、群雄割拠時代に突入しています。

モデルサイズのトレンドとしては、昔はとにかくでかい最強のモデルか、軽いモデル(クローズドモデルで言えばFlashとかLiteとか名前がついているようなタイプ)しかなかったんですけど、ここ最近では、中規模(15Bから70Bの間ぐらい)がちょうどいいスイートスポットになっていて、その利用が増え続けていて、それがある程度のボリュームになってきています。

あとは、何に利用されてるかっていうことなんですが、オープンモデルの場合はロールプレイって呼ばれてるものがほぼ支配的でした。

今年の3月ぐらいまでは8割がロールプレイ。キャラクターAIとかはサービスであるんですが、特に中国で、キャラクターと喋れるアプリがたくさん出ていて、それをオープンモデルにAPIでアクセスして使うっていうようなアプリも結構あって、それの利用がかなり多い。

未だに5割がロールプレイになっています。よく多いって言われているプログラミングは、オープンモデルの中で言うと2割ぐらいで、あとは色々書いてあるんですが、例えば普通に対話してサイエンスの話を聞いたり、健康の問題を聞いたりとかっていうのが多い。マーケティングとかが不思議なことにほとんどない。多いかなと思ったんですけど意外と小さい。

◆Reasoningモデルの台頭と各社モデルの利用状況

今説明したのはあくまでオープンモデルで、クローズドモデルも含めて全体の利用で見たら、かなりの差でプログラミングです。

このプログラミングの利用を軸として見た時に、クローズドがほとんどで、オープンモデルの利用も一応あるけどかなり小さいです。

もう1つの傾向としてあるのは、Reasoning(推論)型が多用されるようになってきました。

Reasoning自体が提唱されたのはOpenAIのo1が最初で、その後DeepSeek r1が出てきたんですが、今年の初めぐらいは利用がほぼ0%だったのが、今は6割ぐらいまで成長していて、今後も多分成長し続けていくと思われます。

それによって使われるトークン長が伸び続けていて、例えばプロンプトトークン(入力に入るトークン数)が大体4倍にこの1年で伸びています。

プロンプトって言ってる部分は、大抵が議事録を書き起こした生のテキストをペタって貼ったりとか、コードをペタって貼ったりとか、そういった感じで入力トークンが4倍ぐらいになっています。

出力の方のコンプリーショントークンも3倍ぐらいになっていると。出力の方は具体的には、ReasoningのThinking(思考)のところがドライバーとなって増えています。

あとは主要カテゴリー、どういった用途で使われてるかに関して言うと、プログラムが大体5割ぐらいにまで増えてきていて、さっきから何回か出ているロールプレイがその次に続いていて、という風になっています。

じゃあプログラムのモデル別のシェアがどうなっているかって言うと、Anthropicが支配的になっていて、6割のシェアを取り続けている。

ただちょっと気をつけなければならなくて、これはOpenRouter経由の使い方なので、直接OpenAIとかGoogleと契約して使ったものは含まれていないです。

なので、OpenRouter経由で使ってる人はAnthropicを使ってる人が多いという結果です。xAIも同じで、多分直接使ってる人も多いと思います。

モデルごとにカテゴリーが違うという結果も出ていて、Anthropicで言えばほとんどがプログラムで、次がテクノロジーの質問なのに対して、Googleはかなり分散していろんな使われ方をしています。翻訳タスクの利用が3位か4位でした。で、大部分が英中・中英翻訳。

xAIもずっとプログラムが支配的でしたが、なんかの機能が入って急にテクノロジーとか他のロールプレイも増えたりしてます。

DeepSeekはずっと変わらずロールプレイで、Qwenが原因は分かってないんですが、一番最後の期でファイナンスがめちゃくちゃ増えているんですね。特定のどこかの企業かなんかがファイナンス向けの利用をめちゃくちゃ増やしてんのかなとかは思います。もちろんOpenRouterは誰がこれだけ爆発的に利用を増やしてるかを把握してるけれども、それは言えませんって書いてます。

◆地域別利用状況と「シンデレラのガラスの靴」現象

地域ごとで、北アメリカ、アジア、ヨーロッパで見ると、北アメリカが多いんですが、アジアがじわじわ増えてきていて、ヨーロッパはちょっと少ないくらいになってます。

トークン数で言うと、日本がシェア1.77%、アメリカが半分のシェア、シンガポールも多いですね。これシンガポールって書いていますが、おそらくシンガポール経由で中国の企業が使ってるのが大半じゃないかなと思います。

あと面白い現象としては、「シンデレラのガラスの靴」現象。

これ英語だと "Glass Slipper" って言うらしいですが、これは何かと言うと、「これだけ競争が激しいから、なかなか競争優位性を築けない」「ちょっとでもいいものが出てきたらすぐそっちに乗り換えちゃう」みたいなことが起きるんじゃないかって思われがちなんだけれど、実はそうではなくて。

一番最初に今まで解けてない課題を解けたLLMが、その後それよりもいいもの(例えばコスパとか性能)が出てきたとしても、乗り換わらないっていう現象が起きているというのがガラスの靴現象です。

最初にユーザーの求めてるものだとか価格帯とかにスポッとはまったものが、一度はまると離脱が起きにくいっていうことを言ってるものです。

なので一番最初に解決すると、例えばプログラムで言えば、コード修正とか最初に解けたAnthropicに、ユーザーが「あ、これすごいわ」って言って移って、その周辺で全部環境とかもできてきたり、サードパーティもそっち向けに最適化されていくので、たとえその後に他のモデルが出てきても乗り換えにくいということが起きる。特許とはちょっと違うような先行者利益の形が出てるっていうことを言っています。

あとは、価格が変わった時にどれくらいユーザーの使い方が変わるのかっていう価格弾力性に関して言うと、ここは価格弾力性は全くない。

価格を変えてもほとんどユーザーの利用は変わらないとなっていて、どちらかというとユーザーは問題が解けるかどうかを優先していて、安いモデルであっても問題が解けないんだったら使われない、というのはある。

とは言え、Gemini Flashとか最近もすごい安いものがたくさん出てますけど、そういったものは、能力は低いけれどそこに合わせた需要のところを取っていて、高いものに関しては、その価値があるところで生き残って、そこで利用されています。

別の言い方すると、LLMの使われ方は非常に多岐にわたっていて、1個のAPI提供という形で見るのではなく、用途ごとに異なり、「いくらまで払ってもいいよ」とか、「どれくらい使ってもいいよ」というような全く性質の異なるのがたくさんいて、価格帯に合わせて自動的に適用が起きて棲み分けてるという風に見ることができます。

この1年だけでもこのぐらいの変化が起きているので、ちゃんと見ていかなくてはいけないし、次の1年を見たらどう変わるのかを予測しながらやっていかねばならないなと思いました。

PFNは新しい仲間を
募集しています

未掲載事例、プロダクト・ソリューション、研究開発についてお気軽にお問い合わせください