01
2024.04.20(Sat)
目次
現在、広く使われている生成AIの多くは、インターネット経由でクラウドに接続して使うのが一般的です。端末のブラウザまたはアプリ上で入力したプロンプト(命令文)は、まずはクラウドへ送られ、その後、クラウド上で作られた回答が画面に表示されます。
一方で、クラウドに頼らない生成AIもあります。それが「オンデバイス生成AI」です。オンデバイス生成AIとは、その名のとおり、AIの処理を手元のデバイス(端末)の中で行う技術を指します。データをクラウドへ送らずに、スマートフォンやノートPC内のAIがプロンプトを処理し、回答を生成します。
もちろん、これらの端末の中に巨大なAIをそのまま収めることはできません。そこで端末メーカー各社は、用途を絞った小型のAIを自社の製品に搭載しています。
たとえばAppleは、iPhoneやMacなどの製品に、文章の要約・校正や通知のまとめなどを端末内で行う「Apple Intelligence」を搭載しました。GoogleもPixelスマートフォンに、録音の文字起こしや要約を端末内で処理できるAI「Gemini Nano」を搭載しました。PCではMicrosoftの「Copilot+ PC」に、リアルタイム翻訳や画像生成に対応したAIが搭載されました。
まとめると、文章の要約や校正、画像編集などの一部機能は、端末内のAIだけで完結できる時代が到来しているといえそうです。
しかし、ブラウザを開けばクラウドの生成AIが使えるのに、なぜ端末の中にAIを組み込む必要があるのでしょうか。
オンデバイス生成AIを使用する最大のメリットは、プライバシー面です。医療、金融、法務、人事などの業務では、個人情報や機密情報を外部サービスに送ること自体がリスクになります。オンデバイス生成AIであれば、データをクラウドに送らず、端末内で処理を完結しやすくなります。もちろん端末そのものの管理は必要ですが、情報を外部に出す範囲を抑えられることは、企業にとって大きなメリットです。
通信環境や速度の面でも利点があります。通常の生成AIでは、入力した文章や画像、音声などのデータがインターネット経由でクラウドに送られます。これに対してオンデバイス生成AIでは、端末内に搭載された小型AIモデルが処理を行うため、通信環境に左右されにくく、応答も速くなります。
特に、翻訳や録音データの文字起こし、メールや通知の要約、写真の補正、簡単な文章生成のような処理では、クラウド上の巨大なAIを毎回呼び出さなくても、端末内のAIで十分に対応できる場面があります。たとえば会議中に録音内容を要約したり、移動中にメールの下書きを整える用途では、通信の往復にかかる時間が省けます。
コスト面でもメリットがあります。クラウドの生成AIを利用する場合、アカウントの利用料金やAPI利用料、通信コストが必要になります。しかし、定型的な要約や分類、入力補助のような処理をオンデバイスAIの端末内で行えば、クラウドの生成AIの利用料金は基本的には不要です。
このようにオンデバイス生成AIには多くのメリットがありますが、万能ではありません。最大の課題は、端末の性能に限界があることです。
クラウド上の大規模AIモデルは、膨大な計算資源を使って高度な推論を行います。一方、スマートフォンやノートPCに搭載できるAIモデルは、端末の処理能力、メモリ、バッテリー、発熱の制約を受けます。そのため、長文の高度な分析や、大量データを使った複雑な判断には向かない場合があります。
精度や機能の差も課題です。端末内の小型AIモデルは、用途を絞ることで軽量化されています。文章の要約や画像補正のような限定された処理では有効でも、専門的な調査や複雑な推論では、クラウドAIのほうが適している場面があります。企業が導入する際には、どの処理を端末内で行い、どの処理をクラウドに任せるのかを切り分ける必要があります。
端末管理の重要性も高まります。オンデバイス生成AIは、情報をクラウドに送らない点では安全性を高めやすい一方、端末が紛失したり、マルウェアに感染すれば、端末内のデータやAI機能が悪用される恐れがあります。業務で利用する場合は、端末の暗号化、認証、遠隔ロック、アプリの利用制御といった管理が求められます。
さらにいえば、端末ごとに搭載されるAIモデルや半導体、OSの機能が異なれば、動作や性能に差が出ることも考えられます。オンデバイス生成AIは、端末の仕様に左右されるのは間違いないといえるでしょう。
このようにオンデバイス生成AIには一長一短がありますが、最近はスマートフォンやPCの中でAIを効率よく動かすための機能が進化しています。
その進化のひとつが、AI処理を効率よく行うプロセッサー「NPU」(Neural Processing Unit)を搭載する端末が増えている点です。NPUは、端末内でAIを高速かつ省電力に動かすための仕組みです。NPUの性能がさらに進化すれば、リアルタイム翻訳、会議メモの作成、画像や動画の編集支援、業務アプリ内での入力補助など、これまでクラウドに頼っていた処理の一部が、より自然に端末側へ移っていくでしょう。

オンデバイス生成AIとクラウドAIは、決して対立するものではありません。高精度な分析や大規模な情報検索はクラウドAIに任せ、個人情報を含む処理や即時性が求められる補助機能は端末内で行うような“ハイブリッドAI”の考え方を取り入れ、用途や目的によって、賢く使い分けるべきでしょう。
オンデバイス生成AIが普及すれば、ネットワークへの接続が難しい環境でも生成AIが使えるようになり、活用範囲はさらに広がります。もし「生成AIを使いたいけど、クラウドには接続したくない」「通信環境の都合上、ネットワーク経由で生成AIが利用できない」という場合には、一度オンデバイス生成AIを搭載した端末の導入を検討してみてはいかがでしょうか。
OPEN HUB
THEME
Generative AI: The Game-Changer in Society
#生成AI