LED通信事業プロジェクト エンジニアブログ
【社内雑談】 ソフトバンクのAI-RANについて
記事更新日 2024年12月10日
はじめに
今回は勝手にシリーズ化しています「社内雑談」を記事にしてお送りしたいと思います。話題は、ちょっと前の話ですがソフトバンクのAI-RANについてです。携帯電話網でAIを動かすって、なんのこっちゃ?と思いますし、恐らく、携帯電話システムの構造にある程度精通していないと、記事だけではソフトバンクが何をやろうとしているのかすら、分からないと思います。いや、我々だってAIの専門家でも何でも無いですから、今後AIと無線通信がどのように融合していくかを予測することは難しいのです。しかし、「何のために無線機器とAIが共存させるのか?」を、一応無線通信側のプロとして、一般のIT記事よりもより無線通信側の視点で触れつつ、AI-RANの話をしたいと思います。毎度毎度のコタツ記事ですので、緩い気持ちで呼んで頂ければと思います。
尚、何度も書いていますが、このブログは個人の見解で、会社としての方針では決してありません。個人が勝手に書いているものだとしてお読みください。また、登場する企業・団体名の敬称は略させていただきます。
なんでRANとAIなの?
社員A(以下A): 先日、ソフトバンクから、AI-RANであるAITRAS(アイトラス)というものが発表されました。携帯電話網とAIの融合らしいのですが、皆さんご存じの通り、ソフトバンクは以前より、孫正義会長を筆頭にAIに注力するということは公言していましたし、それは分かるんです。それは分かるんですが、なぜ敢えて携帯電話網とAIがくっつくのかは、記事からはよく理解できなかったんですけど、どうなんですか?
社員B(以下B): 少し前の話だけど、我々も毎年レポートを上げているMWC※1という展示会で、ソフトバンクを中心に設立された、AI-RANアライアンスという業界団体の設立が、今年発表されていたんだ。先のレポートでも書いたとおり今年のMWCはAI一色になっていて、AI-RANもそういった中の一つだった。でも、現地視察した社員からは、AI乱立の中でAI-RANは「そこまで目立った印象はなかった」という事だったんだよ。というのも、正直その時点ではAI-RANと言ったって、どういったものが作られるのかよく分かっていなかったんだ。AI-RANアライアンスのHPを見ても、この手の団体によくあるような、ふんわりとした夢みたいなものしか書かれていなかったし。
A: 確かに、うちの社内のMWC出張報告書でもAI-RANは触れられていませんでしたし、一般のIT系のニュースでも大きく取り上げられていたという印象はありませんでした。
B: そうなんだ。しかし、そういった流れの中で、今回実際にAI-RANが動く機器を公開したっていうことになる。
A: やっと、中身が公開されたってことですね。
B: そうね。AI-RANの内のRANというのは、無線アクセスネットワーク、簡単に言えば、電波を吹くための装置群のことを指すんだ。現在のネットワークだと、ほぼほぼ基地局とそこに繋がっている回線のことを指す単語になってしまったね。
A: RAN=基地局なんですね。じゃあ、単に基地局と呼べば良いような・・・
B: こんな呼び方しているのには2つ理由があるんだよ。一つは、3GのCDMAの頃はRNCという基地局とは別の装置が存在していて、そいつもRANの一部だった。LTEになって、そいつは消えて基地局一つになっちゃったけどね。それと、もう一つの理由は、今回の記事とも関係するけど、その後基地局が分裂して複数の装置になったから。基地局と簡単に書いたけど、基地局は、基地局という一つの装置ではなくて、基地局という「ネットワーク構造を持つ機器群」になってしまったんだ。
A: 複数あったものが一つにまとまったのに、また基地局は分裂して、ネットワークを組むって感じでしょうかね。
B: そうそう、そんな感じ。それで、その分かれた基地局の片割れに、AIのアプリケーションを入れようって言うのが、今回のAI-RANの話だね。
A: いやいや、なんで基地局装置にAIを入れなきゃいけないんですか!
B: それを説明するには、分かれた基地局について説明しなきゃいけないんだけど。
A: じゃあ、折角なので、説明お願いします。
B: うーん、やや長くなるけど覚悟してね。
基地局って、携帯電話の標準規格である3GPPによって厳密に機能が決められていて、それはレイヤー毎に分かれている。ちなみに、この記事では”基地局”って呼んでいますけど、正しくは、Node B(ノード ビー)と呼んでいるけどね。それで、個々のレイヤーの機能の説明は省くけど、基地局は、ざっくり大まかに3つの機能に分かれているんだ。
- 一つ目は、そもそもの無線接続を制御したり、QoSの判断、そして、パケットの順番や重複などをチェックする。つまり、無線通信を管理する機能。
- 真ん中は、通信のためにブロックの生成やエラー訂正の付与したり、データの多重化を行ったり、変調・拡散したりする。つまり、データを電波に変換する機能。
- 最後は、無線機として、電波を増幅して送受信する機能。
で、元々は、これら全ての機能が「基地局の無線機」として、一つのハードウエア内に存在してたんだよ。結構、大きな装置としてね。で、CDMAの頃に、無線機とそれ以外の処理部に分かれた。もともとの理由は、「鉄塔とかで太い同軸ケーブルを長々引くのがうざかったから」って事だったんだけど、LTEになって使い方が色々と変わったんだ。この辺は、昔の記事だけどここら辺を読めば書いてあるから。
A: 基地局にも、変化してきた歴史があるんですね。
B: 上の図の通り、LTEまでは、信号処理部と無線機の2つに分かれていたんだけど、それが5Gになって、機能の通りに3つに綺麗に分かれたんだ。分かれた、という言い方は正しくないかな?「分けても良くなった」というのが正しいね。別に、従来通り全部一つでも良いし、LTEの頃の様に2つに分けても良いし、5G流に3つに分けても良い。それは、設計次第。
A: 分けられるってことは分かりましたけど、そことAI-RANの関係はなんでしょうか?
B: 分けられるってことは、それぞれ別の装置として存在することが出来るってことだ。別の装置にするってことは、つまり物理的に別の機器、別のハードウエアにするってこと。
知らない人が多いかもしれないけど、これまでの基地局って全て基地局専用ハードウエアで動いていたんだよ。各基地局メーカーが設計、製造した専用ハードウエアでね。だから、どうしても無理も利かないし、自由度も低く、何より高価だった。だけど、基地局の機能をよく見てみると、敢えて専用ハードウエアが必要になるのって、無線機部分のRRHとかRUだけのはずなんだよね。無線機以外は、管理とか信号処理とかの「コンピューターで処理する内容」だから、機能をアプリケーションにして普通のCPUとかを積んだ汎用機(汎用サーバー)で動かしても良いはずなんだ。
というわけで、LTE以降は、上位のBBUやCU・DUを、データセンターで使う様な汎用サーバーで動くアプリケーションとして実装しよう、という流れになった。その方が安くできるし、スケールの変化、つまり通信量の変化にも柔軟に対応できるし、N+1とかの冗長化もし易い。ラックに挿すサーバー数を変えるだけで対応できるからね。
ちなみに、機能をアプリケーション化して、汎用サーバーで動かすことを基地局の仮想化と読んでいる。英語だとvirtual RANでvRAN。ソフトウエアにしただけで仮想化って大げさな、とは思うんだけど、まあみんなそう呼んでいるからね。
A: なるほど、なるほど。何となく見えてきましたよ。
B: CUやDUが、そんな汎用サーバーで動いているならば、そこにAIのアプリケーションも入れちゃおうというのが、どうやらAI-RANというか、今回ソフトバンクが発表した、AITRASのようなんだ。
A: 確かに、基地局とAI、どっちもサーバー上で動くアプリケーションならば、共存も可能ですね。でもね、基地局とAIという全く関係無い2つを、なんで無理矢理に共存させたんですかね?別に、わざわざニコイチにする必要性が感じられませんよ。
B: ちょっと考えて見てほしいんだけど、携帯電話の基地局って、常にフルパワーで動いているわけじゃないでしょ?携帯電話の通信量って時間帯によってバラバラだから、例えば早朝とかの通信する人がほとんどいない時間帯であれば、基地局の中身もほとんど動いていない。そりゃ、常に電波を送受信してなきゃいけない無線機部分は24時間頑張っているだろうけど、信号処理のCUやDUが常にフルパワーかと言えばNOだ。だけど、CUとDUの物理的なリソース、つまりハードウエアは、フルパワー時を前提に準備しなきゃいけない。そうじゃ無いと、逆にピーク時に通信できなくなる。つまり、ハードウエアの必要量ってMAXが基準になるわけだ。ということは、逆に考えれば、ほとんどの時間で計算リソースに空きがあるってことになるんだよね。
A: そうですね。ピークに合わせなきゃいけないけど、深夜早朝とか、逆に誰も使っていないだろうから、その時は計算リソースが余りまくっているでしょうね。
B: だから、その余ったリソースをAIに割り当てようというのがソフトバンクのAITRASの基本的な考え方だ。AITRASは、CUではなく、DUで動かすみたいだけど、それは、CUとDUはツリー構造だから、単純にDUの方が台数が多いからでしょう。そして、おそらくは冗長も含め、これまでも深夜とか時間帯によってほとんど動いていないDUっていうのが沢山あったんだと思うんだよ。ソフトバンクは、そこに目を付けたんじゃないかな。
A: なんか、深夜電力でお湯を沸かすエコキュートみたいですね。原発があまり動いていないから、ちょっと近年下火ですけど。
B: エコキュートか。言い得て妙だね。
どんなインパクトがあるの?
A: でも、AI-RANによって、どのような変化があるのでしょうか?ソフトバンクの公式発表によれば、エッジコンピューティングがどうたら、とか、AIそのものについては、何となくこれまでもあったような内容しか発表されていないという印象だったんですけどね?
B: 私も、AIが今後どうなるか?ってことは全く予想が付かない。というか、誰も予想が付かない。でもね、私はこれを、なかなか増えない5Gの基地局を増やすための、凄く考えられた手段なんだと思っているんだよ。
A: え?なんでですか?
B: 実はこちらの記事にはちらっと書いてあるんだけど、AITRASが広まることによって、基地局でAIの計算がガンガン回せるような仕組みになったら、基地局の余った計算リソースを他社に貸せるようになるんだ。
AI、特にLLMは、学習にも実行にも莫大な計算リソースが必要ってことが、導入のハードルになっている。そのため、AIサーバーを自前ですべて準備しようと思うと莫大な投資が必要で、普通の企業になかなか出来ることじゃない。だから、AIサーバーの計算リソースをレンタルするというビジネスが成り立つし、すでにそういうビジネスは存在している。もしそれが、AITRASでも可能になるなら、基地局そのものをマネタイズできる。
A: LLMとかのための計算リソースを他人に貸せる可能性があるんですね。
B: これまで、基地局を建てる、維持するってことは、ユーザーの満足度は上がるものの、ぶっちゃけコストでしかなかったわけ。極論だけど、ユーザー満足度が下がらないなら、基地局数はできるだけ少ない方が良かったわけ。でも、通信と関係無く基地局単体でマネタイズできるのであれば、話は別だ。過剰に思える基地局投資も、計算リソースの足しになってくれるのであれば、また違う考え方も出来る。
A: つまり、通話料的にはあまり儲からない5Gの基地局であっても、投資して数を増やす意義が出てくると。
B: そうそう、そういうことです。
A: さすが、ソフトバンク!上手いこと考えますね。
B: それともう一つ。ソフトバンクと離れるけど、今回マスコミ発表ではあまり強調されていないけど、私には重要に聞こえた情報があった。それは、このDUの処理にNVIDIAのGH200 Grace Hopper Superchipを使っているということ。
A: え?それが、どんな意味を?
B: Grace Hopperって、CPUとGPUのセットになっている、AI向けのサーバー用チップセットなんだ。それで、無線機が動かせるってことだ。
A: そりゃ、汎用サーバーで動かせるんだから、AI向けサーバーでも動かせますよね。
B: 携帯電話に必要な計算って、「1つ1つはほぼ同じ信号処理なんだけど、パケットの数だけ必要になる」ものなんだ。これって、CG描写やAI計算に近くて、明らかにGPUが得意なタイプの計算なんだよね。CPUでやるより、GPUでやった方が絶対にお得なはず。だから、NVIDIAもvRANに参入しようと頑張っているわけだ。それ以前に、GPUを大々的に作っている会社なんて、NVIDIAじゃなきゃAMDぐらいしかないから、そもそも論として、GPUによるvRANが出来るのはその2社しか選択肢は無いわけだが。
A: 確かに、GPU業界は事実上NVIDIAかAMDの2択ですよね。Intelも作っているとは言えなくはないけど・・・
B: 現状のIntelは、vRANをCPUで動かしていて、vRANという点ではGPU2社を先行していると言えると思う。けどね、さっきも言ったとおり、基地局の計算は、絶対にGPU向きだから。きっと、今後通信速度やシステムの世代が上がる毎に、CPUベースとGPUベースとでは差が出ると思う。
で、そのGPU含めたサーバーの構成が「vRAN用にカスタマイズしなければいけない」ものなのであれば、価格的にCPU vRANでもGPU vRANに対抗できるかもしれない。つまり、GPUベースであっても、vRAN専用ハードウエアになるのなら競争力は高くない。でも、vRAN向けの専用GPUサーバーでなく、LLM向けAI用のGPUサーバー上でvRANが動くとなると、これは大きい。NVIDIAの次の野望が、いよいよスタートするってことだなと。
A: そういう観点ですか。vRAN向け専用じゃ、折角の汎用サーバーで安くするって意味も半減しちゃいますもんね。
B: もちろん、vRAN専用って言っても、これまでの基地局の様なASICやらFPGA※2で作ったものではなくて、汎用CPUと汎用GPUで構成されたものという前提だから、汎用と専用でそこまで大きな違いはないと思う。それでも、例えばストレージだったり、バスだったり、メモリだったりがvRAN専用ってなると、面倒くさいでしょ?
でも、CU・DUがNVIDIAの「普通の」AI用GPUサーバーで動いちゃうということは、AITRAS抜きにしても、それを選択する事業者も増えるのかな?と。ひいては、CU・DUにNVIDIAが採用される可能性が、ぐんと高まるんだろうなってことで。
A: なにせ、AIサーバーは現状数も出てますから、性能面だけじゃなくて、信頼性や運用のしやすさでもメリットがありますよね。
B: ただ、今現在だと、NVIDIAの、恐らくはTSMC※3のAI向けGPU生産そのものが全く追いついていないので、携帯電話のCU/DUをNVIDIAのサーバーに置き換えるという贅沢な選択は採りにくく、急に数は増えないはず。それでも、NVIDIAが基地局みたいな安定して数が出るビジネスに食い込むことが出来るのなら、多少AI半導体の方ででライバルが出てきたとしても、業績の安定材料にはなよるね。
A: 半導体業界は浮沈が激しいですが、携帯電話基地局みたいな、定期的に一定数出る事がが保証されているビジネスを持っておくことは、有り難いことですよね。
B: これ以上、上げられるのか?と思われるNVIDIAの株価が、まだ上がるのかと思うと恐ろしいけどね。
AITRASで動くAI
A: 先にインパクトがないと書きましたが、一応AITRASで動くAIについても触れて貰えますか?
B: エッジコンピューティング関連は、繰り返しになるけど、私には正直どうなるか全く分からない。AppleとかGoogleとかがやっているLLMの小型化が花開く可能性もあるし、これまでのエッジコンピューティングのように、バズワードで終わってしまう可能性もあるし。
A: あまり、エッジコンピューティングにポジティブじゃないんですか?
B: いや、そういうことじゃないけどね。ただ、現状、正しい使い道が分からないってだけで。それより、ソフトバンクの言っている「ネットワークの品質が上がる」というのは多いにあると思う。
A: いきなり、そちらですか?何故ですか?
B: 私は、無線ネットワークの最適化とDL系AIって、非常に相性が良いと思ってるんですよ。無線ネットワークの最適化って、残念ながら100%の正解はないんだ。これまでは、人間が、シミュレーション結果とかから考えて、「状況的におそらく最善だろう」という調整をしていただけなんだよね。だから、感覚としては、「機械の調整」よりも「人間の病気の治療」の方が似ていると思っているぐらいだし。
A: ネットワークの最適化は医療に近いという意見ですね。確かに、医療も根本原因が分からないことが多くて、対処療法の積み重ねだったりしますものね。
B: 仮にそれを自動化しようとした場合、人間が組んだアルゴリズムとかだと、完全な正解を求めに走っちゃう。なんか、いくつかのKPI求めつつ、条件総当たりしてKPI最大化した場所を選ぶとか。けどさ、無線ネットワークの最適化って、その場所場所で条件が違ったりして、ツール上では見えないパラメータがいくつもある訳よ。そう言う中で、人間が思いつくような、現実世界より少ないパラメータやKPIで答えを求めようとしちゃうと、どっかで値が発散しちゃったりして上手くいかない事が多いんだよ。アルゴリズムを作る側が想定した以上の事が起こったりしてね。だからなのか、これまでネットワーク最適化の自動化って、構想は沢山あったんだけど、実用化はほとんどしてなかったんだよね。
A: 一般的なプログラミングだと、確かにそういう感じになることがありますよね。
B: けど、DLとかLLMとかのAIは、完全な正解を求めるのは苦手でも、「何となく正解っぽい」を選ぶのが得意。80%ぐらい合っているとか、そんな感じの答えが得意なの。AIなら、扱えるパラメータも人間が介在するよりも桁違いに多くできるし、人間では気付かないような微妙な変化にも気付いたりするから、人間より良い判断をする可能性も高い。だから、AIは「100%の正解は誰にも分からないが、80%ぐらいの正解ならば必ずある」っていう無線ネットワーク最適化に、とっても向いていると思ってるんだよね。レントゲンとかCTとかの画像診断が、人間よりAIに向いているのに近いよ。
A: へー、そういうもんなんですかね?
B: もちろん、今後実装して上手くいかないことが沢山出ると思うけど、それでもこの作業がAI向きなのは絶対に間違いない。だから、エリクソンやノキア、ファーウェイの様な基地局メーカーは、AIによる無線ネットワーク最適化に、かなり力を入れているよね。将来、AI化されるのが間違いないのであれば、そもそもの基地局に実装してしまうっていうのは、大いに有効だと思う。
まとめ
A: では、時間が来たのでまとめをお願いします。
B: 今日、話題になったAITRASは、AI-RAN構想のほんの一部だとは思う。そのAITRASだって、いくら高速回線で結んでいるとは言え、かなりの数に分散してしまう計算リソースをどのようにコントロールするのか、実装までに色々と課題はあると思う。でも、AITRASが実現すれば、事業者側は基地局を沢山打つモチベーションになるし、ユーザーは通信品質が上がるし、携帯電話ユーザーすべてにとってメリットになると思う。
と、持ち上げているけど、これが実現したら、携帯電話事業者は巨大通信会社としての顔だけでなく、巨大計算リソースセンターとしての顔も持つことになり、今まで以上に情報インフラを牛耳ることになったために・・・ ってオチになるかもしれないのですが。
A: 携帯電話事業者が、AWS※4かそれ以上のものを持っているイメージになるかもしれないんですよね。
B: 可能性の話だからね。いずれにせよ、当面のボトルネックはNVIDIAの半導体調達となるはず。今現在ですら、AI向けGPUが入手できないと大騒ぎだしね。基地局は数が多いから、まず数が確保できないと、どうしようもない。
A: 結局は、また半導体業界の話になるんですね。
B: そして、NVIDIAが儲かろうとAMDが儲かろうと、GPUが売れるということは、最終的にはTSMCが儲かるというのも恐ろしい話だ。
A: 「半導体は21世紀の石油」とはよく言ったものですね。
B: それは、日本が21世紀も産油国には成れていないってことを意味するんだけどね・・・
※1; Mobile World Congressの略。毎年2月頃にスペインのバルセロナで行われる、世界最大の通信関係の展示会。世界各国から通信業界の人々が集まる。
※2; ASICは、特定用途専用に設計・製造されたIC。FPGAは、専用設計ではないが、特定用途向けにプログラミングされたIC。どちらも、これまで無線機専用ハードウエアで使用されてきた。
※3; 台湾積体電路製造股份有限公司。世界最大の半導体ファウンドリ。NVIDIAやAMDの高性能GPUは、ほぼ全てTSMCが製造している。
※4; Amazon Web Serviceの略。世界最大のクラウドサービスであり、多くのWebサービスがAWS上で動いている。