中国からやってきた DeepSeek が話題になっている。OpenAI の ChatGPT 並みの性能であり、オープンソースで公開されているモデルもある。
これはゲームチェンジャーに成り得るのか?
もちろん、成り得ると思う。
公開されている情報を見る限りは、OpenAI/Microsoft、Google、Meta に対抗するような形で大規模な計算資源を投入し、開発されたという。Nvidia の半導体も大量有しているとの記事もある。
How small Chinese AI start-up DeepSeek shocked Silicon Valley
後発だけあって、既存の製品やオープンソースプロジェクトを参考に、改良点を加えられていることが興味深い。最大のポイントは、先端半導体をこの先も買い続けることが難しいという背景を踏まえ、先端半導体に依存しない仕様を目指してる点だ。
通常は、エネルギー効率を良くするため、半導体の構成を変えてみたり、生成 AI に関する処理の役割ごとに最適化した半導体を活用したりする中で、先端半導体にのみ依存しない AI モデルを構築していくのが王道であった。ところが今回は、手に入らない半導体資源という制約を前提にしている。あるいは、世代遅れの半導体を用いて、それでも速度もエネルギー効率も良いモデルを開発しようと明確に目指していたのだろう。
エネルギー問題や、半導体の限定的な入手による制限がきっかけとなるのでは無く、そもそも先端半導体にリーチできないという事と、一方で環境問題の懸念を除けばエネルギーは豊富に調達できるという立場から、着想して作られたのではないだろうか。エネルギー効率を無視した場合、エネルギーさえ潤沢にあれば勝ち目はある。
さらに考えされられたのが、AI モデルを構築する上でどのようなデータを学習させたのか、ということだ。先行するアメリカ系大手よりも早く、効率よく、他社が追いつけないレベルの性能を出すためには、一体どれほどの密度の濃い情報が、どれほどの量、投じられたのだろう。ここは、アメリカ企業にはできない判断とアクションであった可能性を感じる。
そもそも、決済の電子化に伴う与信情報の利活用において、中国企業のネットワークは先進的であった。生成 AI を用いた経済政策、安全保障政策という枠組みで考えれば、国が協力する形でデータを積極的に活用すれば、民間企業単位で争う次元を超えた性能を出せる可能性は確かにある。それでも、一旦は性能が高くても、今後の半導体の成長に合わせて相対的に性能が下がる可能性が考えられるはずだ。しかしそれすらも見越しているとすれば、対策をとらないわけがない。大規模データと超高性能な先端半導体がそろって必要であるという前提を無視したアプローチで開発され、かつ今後はこれまでの成果に基づいて自己学習強化がされていくのであれば、エネルギーと精密なデータの総量での戦いとなる。そうなれば、優位性を維持できる可能性があるのではないだろうか。
そして今回の無料、格安での一般開放だ。これよにって、多くの人が利用することで、新たな可能性が開かれる。自社、自国だけでは不可能であった、多様性のある追加のデータを集めることができるわけで、シリコンバレー的な動きだ。会社のバックグラウンドも、金融の色が強い。多層的にレバレッジをかけて、経済的効果を狙いながらも、一気に学習を加速させようとしている。
個人的にはそこに危機感を感じるのだが、利便性と経済合理性の前では危機感など無力だ。人々は簡単に情報の価値を手放すことをシリコンバレーが教えてくれた。よって、先行して世に問うことが何よりも重要だった。
発表のタイミングも完璧だ。アメリカの新生トランプ政権が稼働するにあたって、中国企業として、中国として、受けるであろう影響を十分に考え、先行して対策をしているように見える。エネルギーの総量、データの総量。半導体の性能や環境負荷という条件を外し、本気で結果を取りに行く戦いが始まったのでは無いだろうか。アメリカのエネルギー政策の転換は、ここでも大きく意味を持ってくる。
そんなアメリカ企業と DeepSeek の戦いの中、見落としがちな事が2つあると思っている。
- 生成 AI の開発において大量のデータはそもそも必要なのか
- 今後も継続的に演算性能重視な先端半導体は必要なのか
どちらも No である可能性が示唆されており、肯定されれば市場で評価されている企業の価値が大きく変わってしまう。先行する大手企業の価値とは?金融系企業の強みとは?テック企業の高い利益率の根源は?果たしてどうなるのだろう。
ルールが書き換わるタイミングでのみ起こる、緊張感のある戦争が今まさに起きている。
