Generative AI: The Game-Changer in Society

2024.05.31(Fri)

OPEN HUB Base 会員限定

キーワードはLLMの多様化。民主化をキーワードに進むAI開発のこれから

#イノベーション #AI
2023年は「生成AI元年」とも呼ばれ、ChatGPTに代表される生成AIが急速に普及。2017年頃から提唱されていた、専門知識を持たない多くの人々がAIを使えるようになる「AIの民主化」という概念がここにきてあらためて注目されるようになりました。そうしたなかで日本電信電話(NTT)は独自開発した言語モデル(LLM)を用いた生成AIのサービス「tsuzumi」の提供を2024年3月に開始。ChatGPTのような対話型AIが大規模LLMを志向する一方で、軽量で専門性や高度化といったカスタマイズが比較的容易なtsuzumi のようなLLMの登場は、AIの恩恵をさらに多くの人に届けることを可能にします。こうした「LLMの多様化」も、AIの民主化の1つの姿といえるでしょう。

急速に進むAI開発の波のなかで、AIの民主化はどのような意味を持つものなのか? tsuzumiの開発をリードしたNTT人間情報研究所上席特別研究員の西田京介、同研究所にて視覚読解技術の研究開発に携わる田中涼太、企業に対する生成AIを活用したビジネスコンサルティングやソリューション提供に携わるNTTコミュニケーションズ ジェネレーティブAIタスクフォース長の荒川大輝とともに、「AIの民主化」の現在地と、発展の先にあるべき姿を探りました。

この記事の要約

ChatGPTに代表される生成AIの登場により、AIの活用が身近なものとなり「AIの民主化」が進みました。しかし、現状ではChatGPTが圧倒的シェアを占めており、真の「民主化」に向けては多様なLLMの選択肢が必要とされています。

NTTは、小型で専門性の高いLLM「tsuzumi」を開発しました。tsuzumiはChatGPT のようなLLMに比べてパラメータ数が1/25程度と小さいながら、高い日本語処理性能を持ちます。小さなLLMの利点は、短期間で構築できる点や少ない計算リソースで動作する点などが挙げられます。

今後はマルチモーダル技術の発展により、視覚や音声などのモーダルを組み合わせた知覚AIが実現すると期待されています。NTTは「AIコンステレーション」の考え方にもとづき、大小さまざまなLLMが連携しながら人とAIが共生する社会を目指します。そのためには多様なLLMが共存し、互いに意見を交わすことが重要です。

※この要約はChatGPTで作成しました。


ユーザーと提供者、双方にとっての「AIの民主化」が始まった

――ChatGPTに代表されるAIツールの普及に伴い、「AIの民主化」という言葉を目にすることが多くなりました。まず、この「AIの民主化」というキーワードについて、皆さんはどのようにお考えでしょうか?

西田京介(以下、西田):ChatGPTのような生成AIが登場したことで、AIを活用して生産性や効率性を高めることのハードルが大きく下がりました。昨今「AIの民主化」といわれるようになった所以は、こうした変化によってAIの活用が多くの人にとって身近なものになったことが背景にあると思います。ただ、一般の人々がAIを使うことができるシーンはまだまだ限定的であり、現実には民主化の一歩手前の状況ともいえると感じています。

一方で、AIの研究のあり方も大きな変化を迎えており、ある意味でAIが研究者の手を離れつつあると感じます。何が起こっているのかというと、長年AIについて研究してきた私たちのような専門家だけでなく、より多様で幅広い領域から人材を集め、知見を持ち寄り、AIの研究開発を加速させていく機運が高まっているのです。利用と研究開発の両面において、AIの分野に新しい人材や知見がものすごい勢いで入ってきている状況なのだと思います。

「民主化」にはさまざまな意味合いが含まれると思いますが、「民主主義化」という観点では、現状ChatGPTが生成AI分野ではかなりのシェアを占めているという意味でまだまだ発展途上にあると感じています。特にLLM(大規模言語モデル)という視点で、真の「民主化」を目指すにあたっては、1つの巨大なLLMですべてを解決しようとするだけではなく、多様なLLMの選択肢が増えていくことが重要だと考えています。

私たちNTT人間情報研究所では、AIが星座のようにつながりながら問題を解決していく「AIコンステレーション」というコンセプトを掲げているのですが、tsuzumiのような新たなLLMの開発を通じてこのコンセプトを実現しつつ、「AIの多様化」「AIの民主化」に貢献していきたいと考えています。

西田京介|NTT人間情報研究所 上席特別研究員
2009年日本電信電話株式会社入社。2024年よりNTT人間情報研究所上席特別研究員。NTT研究所における大規模言語モデルtsuzumiの研究開発を統括。LLM、機械読解(質問応答)、Vision-and-Languageを専門とし、2018~2024年言語処理学会年次大会(NLP)優秀賞(2018、2021年最優秀賞)など受賞

田中涼太(以下、田中):ChatGPTの登場以降、「プロンプトエンジニアリング」と呼ばれる技術が脚光を浴びています。これはAIから望ましい出力を得るために、指示や命令を設計、最適化する技術なのですが、ChatGPTはその活用において非常に画期的だったと思っています。これまでのAI技術は、企業や大学の研究者が中心となって、データを集めたりモデルのアーキテクチャを変更したりと、1年から2年の単位で技術構築を行ってきました。しかし現在は、ChatGPTや私たちが開発したtsuzumiのような基盤モデルさえあれば、普段使っているような言葉で指示を与えるだけで、例えば文章の要約や翻訳をするプログラムを組むなど新たなAIシステムを個人で構築できるようになりました。これは非常に大きなブレイクスルーであり、「AIの民主化」を表す現象の1つであると考えています。

田中涼太|NTT人間情報研究所 思考処理研究プロジェクト 研究員
2020年 日本電信電話株式会社入社。東北大博士後期課程在籍中。文書を“見た目から”理解する視覚読解技術の研究開発を推進し、関連研究がAI分野における最難関国際会議 (AAAI) にて複数採択、国際コンペ (ICDAR2021 DocVQA competition) でのrunners-up受賞。NTT版LLMのtsuzumiにおける、画像入力を可能とするアダプタ技術を開発

荒川大輝(以下、荒川):従来のAIと違い、生成AIでは「データがなくても何かしらの結果が得られるようになった」というのが大きなポイントといえます。従来はAIを活用したアプリケーションやシステムを動かす場合、まずは用意された大量の既存データが起点となり、そのデータをいかにして加工、利用するかが主要な論点でした。

しかし、ChatGPTのような生成AIでは、あらかじめ学習データを用意しなくてもAIが何らかの成果物を生成してくれます。データ面での導入ハードルの低さから、さまざまなアプリケーションやシステムのUXパーツとしてAIが組み込まれるようになり、結果として多くの人々がAIに触れたり利用したりする機会が増えたこともAIの民主化が進んだと言われる所以だと思います。

荒川大輝|NTTコミュニケーションズ ジェネレーティブAIタスクフォース長
2016年より自然言語系AI「COTOHA」の開発を牽引。対話AIなど自然言語処理を活用した複数のAIプロダクトを創出。その後、メディカル・ヘルスケア分野におけるAI開発を経て、2023年から生成AIプロジェクトに参画。現在生成AIを活用したソリューション事業展開を担うジェネレーティブAIタスクフォースをリード

生成AIがもたらしたインパクトとは?

この記事は OPEN HUB BASE 会員限定です。
会員登録すると、続きをご覧いただけます。