Coming Lifestyle

2023.11.15(Wed)

「本音を話せるAIコンシェルジュ」の条件とは。
人工知能研究者と考える、“愛されるAIサービス”のつくり方

#ロボティクス #スマートライフ #CX/顧客体験 #データ利活用 #AI #金融
ChatGPTなど対話型生成AIの登場により、AIの存在はより身近なものとなりました。内閣府も「人間中心のAI社会原則」を策定し、社会の中でAIをどう活用していくか、という模索が始まっています。さまざまなAIサービスが登場し、今後さらなる競争の激化も見込まれる中、ユーザーに支持されるAI活用ビジネスを実現するためのポイントはどこにあるのでしょうか。

今回、デジタルヒューマンやAIアバターによる接客・販売サービス「バーチャル・コンシェルジュ」を構想し、継続的にワークショップを行っているNTTコミュニケーションズ(以下、NTT Com)の吉岡克哉が、慶應義塾大学理工学部教授で人工知能学会副会長・倫理委員会委員長の栗原聡氏、「ドラえもんをつくる」プロジェクトに取り組む注目の若手研究者で日本大学准教授の大澤正彦氏とディスカッションを実施。AI活用ビジネスにおいて優位性を得るためのヒントを探りました。

目次


    ドラえもんから、アリの行列まで。AI研究を通じて見えてくる、人間や社会の本質

    吉岡克哉(以下、吉岡):お二人は社会におけるAIの有用性を追求されているエキスパートですが、研究対象としては重なる部分と異なる部分、それぞれおありかとお見受けします。どのようなきっかけでAIや情報科学、ロボット研究に取り組まれるようになったのか、現在どのような領域に関心があるのかを教えてもらえますか?

    栗原聡氏(以下、栗原氏):学生時代はコンピューターのOSを研究していました。その中で当時、NTT基礎研究所でプログラミング言語や人工知能のシステム研究をされていた竹内郁雄先生のチームに興味を持ち、博士課程に行かずにNTTの研究所に入りました。そこでプログラミング研究を深めていくうちに、実行するタスクの順番や選択を自律的に判断する「エージェント」というプログラムの概念にとても興味が出てきたのです。

    栗原聡|慶應義塾大学理工学部教授、共生知能創発社会研究センター長
    慶應義塾大学大学院理工学研究科修了。博士(工学)。NTT基礎研究所、大阪大学、電気通信大学を経て、2018年より現職。人工知能学会副会長・倫理委員会委員長。著書『AI兵器と未来社会キラーロボットの正体』(朝日新聞出版)、監修『人と共生するAI革命』(NTS)など多数刊行。手塚治虫没後30年を迎え立ち上げられたAIによる手塚治虫新作創作プロジェクト「TEZUKA 2020」でもAI開発を担当した

    AIの父といわれるマーヴィン・ミンスキーという偉大な研究者がいました。彼が名著『心の社会』において語っていたのは、人間の心はいくつもの自律分散した「小さい心」から成っており、それらが社会を形成して人としての「知能」を生み出している、という考えでした。そもそも我々の脳は、膨大な数の脳神経細胞の集合体で、一つひとつの神経細胞が何かを推論したり考えたりするわけではありません。でもそれらが集まり複雑なネットワークを組む、つまり「大規模で複雑な群知能型システム」となることで、状況を推論したり相手のことを考えたりする高度な知能が生まれます。

    アリが列を成すのがわかりやすい例なのですが、1匹1匹のアリは「列をつくろう」として行動しているわけではありません。脳に組み込まれたプログラムに従って自律的に行動した結果、列を創発してたくさんの収穫物を巣に運んだりする。AIを研究するうえで、生物の知能や人の心を考えることは極めて当然で重要なことなのです。

    こうした背景から、多数のAIが群れて協調することで大きなパワーを出す仕組みについての研究をずっと続けています。例えば交通・インフラ技術として、各交差点にAI信号機を設置して信号機同士がネットワークを組むことで渋滞の解消を図ったり、コロナ禍では、3D空間環境にAIを解き放って感染状況をシミュレーションしたり、といったプロジェクトを進めました。また、TEZUKA2020に続き、生成AIを活用して手塚治虫氏の新作マンガを制作するTEZUKA2023プロジェクトを立ち上げたりしています。

    大澤正彦氏(以下、大澤氏):栗原先生は「鉄腕アトム」の生みの親に携わる仕事をされていますが、私は物心つく前から「ドラえもんをつくりたい」と考えていました。ロボットをつくるために小学生のころに電子工作を始めたんですが、ドラえもんができ上がる実感がなく、そこで出合ったのがプログラミングでした。

    大澤正彦|日本大学文理学部情報科学科准教授、次世代社会研究センター(RINGS) センター長
    2020年3月、慶應義塾大学大学院理工学研究科 開放環境科学専攻後期博士課程を修了し、2023年4月より現職。IEEE Young Researcher Award(最年少記録)をはじめ受賞歴多数。著書に 『ドラえもんを本気でつくる』など。一貫して「ドラえもんの実現」を目標に掲げるロボット/AI研究や、プロジェクトベースではなくコミュニティーをベースにした「ウニ型」組織であるRINGSの運営など、ユニークな研究スタンスも注目を集める

    ところが工業高校から慶應義塾大学の理工学部に進んだころ、小さい時からずっと技術畑しか知らないことに危機感を覚えはじめました。「技術の世界だけにい続けたら、みんなが愛してくれるドラえもんはつくれないのでは?」と考えるようになったんです。

    そこで大学に入ってからは社会感覚を養おうといろいろなことに取り組みました。子どものためのボランティアサークルに入ったり、デパートで販売員のアルバイトをしたり。そうして3年後に初めて研究室に配属され技術の世界に戻ったころ、脳全体のアーキテクチャ(構造)から人間のような汎用人工知能をつくることを目的とした「全脳アーキテクチャ」というコミュニティーの存在を知ったんです。そこに飛び込んだところで栗原先生との出会いがあり、「全脳アーキテクチャ若手の会」を立ち上げて、研究とコミュニティーという両輪の活動をスタートさせました。研究半分、コミュニティー半分ではないですけれど、ドラえもんをつくるうえでは「ともにつくる」という社会性や客観性が大事だと思ったからです。

    栗原先生のお話にあったように、IT研究から生物学につながったり、生物を観察すると複雑系や社会につながったり、学問領域にカテゴリーはあれど根っこの部分はつながっています。すると1人ではやりきれないですし、それに「みんなでつくるドラえもん」と「1人だけでつくるドラえもん」のどちらが社会に受け入れられそうかと考えたら、圧倒的に前者ですよね。そんなことを考えて、今も活動を続けています。

    コミュニケーションAIに求められる要素とは

    吉岡:AI研究を通じて、人間の心理や社会的な営みの理解へとつなげられている、ということですね。我々もコミュニケーション×AIという領域に取り組んでいます。

    私はこれまで、ビジネスプロデューサーという立ち位置から、金融業界を主な対象として、先進技術とビジネスを結びつける仕事をしてきました。例えば、新しい法制度に伴う企業間決済の仕組みを立ち上げたり、コールセンターにおける音声認識や音声自動応答技術の導入に携わったりしてきています。

    そこからさらにデジタル技術が進化し、コミュニケーションAIという領域が出てきた中で、自然言語で対話ができる生成AIチャットボットや画像生成AIによるリアルなアバターなどが登場してきました。「こうした新しい技術を組み合わせれば、これまで人間が担ってきた接客対応や営業を行うAIコンシェルジュを実現できるのではないか」という仮説が生まれたんです。

    イメージとしては、店頭やカウンター、そしてリモートのコンタクトセンターでアバターが接客し、後ろの対話部分は、ボイスポッドもしくは人間のスタッフが担うというもので、「バーチャル・コンシェルジュ」と呼んでいます。

    NTT Com×東映ツークン研究所×NTT QONOQで開発したデジタルヒューマン「CONN」による接客サービスも展開される想定
    吉岡克哉|NTT Com 金融DXエグゼクティブディレクター、MBA(ファイナンス)、ITストラテジスト Chief Catalyst /Business Producer
    日本債券信用銀行((現)あおぞら銀行)入行後、B2B金融事業企画や子会社(ブループラネット社)設立に参画。NTT Com入社後、2008年より経済産業省委員として、電子記録債権法設立に関与。日本初の電子記録債権システム開発リーダーを経て、2020年より第一ビジネスソリューション部金融CX/EXリーダーとして、金融機関のDX推進を支援。2021年、金融DXエグゼクティブディレクターに就任。

    現在、複数の保険会社と共同でファイナンシャルプランニングの相談に乗るバーチャル・コンシェルジュの実証実験を進めています。最終的には、保険商品の相談から契約を締結できるまでにしたいと考えていて、コミュニケーション部分には、ChatGPTの開発元であるOpenAIと事前に定義したルールベース型エンジンを組み合わせています。外観はCGや画像生成AIを利用しアバターを制作しています。

    栗原氏:コミュニケーションのコアな部分にも自然言語系の生成AIを活用されるのですね。

    吉岡:はい。生成AIを使えばちょっとした雑談、例えば「来年子どもが生まれるんです」と言えば、「おめでとうございます。ではお子さんのことも踏まえたファイナンシャルプランを考えていきましょう」と答える、といったように臨機応変な相談を進められると考えています。

    また、東映ツークン研究所の高度なCG技術や、イスラエルのD-IDが開発した「Creative Reality Studio」という動画系生成AIサービスを利用することで、人が話しているのと見間違うような動きをつくることも可能になってきました。

    このように、外観や対話では、人に近いコミュニケーションができるテクノロジーが整ってきてはいますが、将来の資金計画のような大事な相談で、直ちに人によるコミュニケーションにとって代わるかというと、まだまだ壁があるように思います。この先、バーチャル・コンシェルジュが人々に受け入れられるようにするためには、何が必要でしょうか。

    栗原氏:我々人間にとってのコミュニケーションの主要な目的は、「お互いがお互いの意図をちゃんと理解している」という手応えに起因する信頼関係の獲得なのだと思います。高額な保険商品を契約するとなれば、「AIと人間が信頼関係を築けるかどうか」が大事なポイントになるのではないでしょうか。

    例えば、私たちがコンピューターを信頼するのは、それがきちんと「自分の思い通りに動く」からですが、人間同士の場合だと相手が本心で何を考えているのかはわからないですよね。それでも信頼を置くということは、「自分の思い通りに動く」からではない、何か別の判断基準があるからだと思います。AIに対しても、コミュニケーションを前提とするのであれば、「コンピューター」としてではなく、いわば「人間のように」信頼できることが重要かもしれません。

    吉岡:なるほど。AIが“人として信頼される”には、リアリティの追求だけが選択肢とは限らないのですね。

    AIは道具ではなく「仲間」?

    大澤氏:AIと人間の信頼性をどのように築くか、という点は非常に興味深いです。最近私のメインの研究は、人間がエージェントをどのように認知するかを想定して、両者の理想的な関わり合いをデザインする「ヒューマン・エージェント・インタラクション」という領域になりつつあるのですが、AIを“人間として信頼する”とはどういうことなのか、考えるヒントになりそうです。

    この学問領域では、哲学者であり認知科学者でもあるダニエル・デネットが提唱する「3つのスタンス」という理論が前提にされています。簡単にいえば「人間は対象を理解・解釈する際、3つの予測モデルを使い分ける」という考え方です。

    例えば、スマートフォンを手に持ち「手を離したら落ちる」と考えてその通りになるとしましょう。これは「物理スタンス」です。でも「画面をスワイプしたら起動する」というのは物理法則とは関係ありません。そのような物理的に説明すると複雑な原理や法則は無視して、代わりにルールや設計を考える「設計スタンス」を使っています。そこに電話がかかってきて、会話が始まりました。すると今度は物理も設計も無視して、「何の用事で電話してきたのかな」と相手の意図を考える「意図スタンス」が作動します。

    昨今のAIサービスでは、設計スタンスと意図スタンスをごっちゃにして考えてしまっていることが多いと思います。AIを「思い通りに動かせる」道具として捉えるか、「信頼して話せる」仲間として捉えるのかを先に定められれば、最適なサービスデザインができるのではないでしょうか。

    人工物を意図スタンスで捉え直す好例としては、「弱いロボット」というゴミ箱型ロボットの研究がユニークです。ゴミ箱の形をしているのにゴミを拾う機能を持たず、ただゴミの側でウロウロしているだけのロボットなんですが、それを見た人間がゴミに気付いてゴミ箱に入れる。設計スタンスで考えると「このロボットは何のためにあるの?」となりますが、「意図」を動作で表現することで、「ゴミを拾いたいんだな」と人間がそれを助けるようになるんです。

    普通なら人工物に意図スタンスは向けないけれど、「万物に魂が宿る」と考えるアニミズム思想の影響が強い日本は、人工物を擬人化したり仲間だと思ったりする。こうした考え方も、ユーザーがAIアバターに信頼感を抱くための体験設計や、そうした信頼感を交渉の推進力に活かすフローチャートの構築、といった部分などでヒントになるのではないかと思います。

    「圧倒的支持を集めるAIサービス」の実現はすぐそこまで来ている

    栗原氏:ロボットが人から信頼されるための研究や、ノンバーバルコミュニケーションに関する研究はこれまでも多くの取り組みがありますが、今後はこれまで以上に重要になってくるのだと思います。

    勝手に人についてきたり、目が動いて移動する我々の方を常に向いてくれたり、それだけで人間はロボットに「生きている!」と感情移入できてしまうんです。ところが、いざロボットをつくろう!となると、いかに機能を増やすか、性能を高めるかといった設計スタンスが加熱しがちで。最後はいつも「それで、どうすれば信頼関係を築けるんだっけ?」というところに戻ってきてしまう。

    大澤氏:研究分野ではエージェントとしてのアンチパターンが蓄積されているのですが、そうした知見が見過ごされて開発が進んでしまうケースは少なくありません。専門家も巻き込みながら、どうすればユーザーの信頼が得られるか、そこにどのような技術的課題があるか、といった踏み込んだ仮説などもあると、実証実験もさらに豊かなものになっていくのかなと感じました。

    吉岡:確かに保険や金融商品の営業というのは、担当者がお客さまに親身に対応することで、「あなたなら信用できるから」と人間性を信じてもらって契約が成り立つものです。CONNのプロジェクトなどで行ってきたリアルさの追求に加え、信頼感を醸成するには何が必要か改めて考えてみることが重要ですね。バーチャル・コンシェルジュの実証実験を進めていく中でも、心に寄り添うAIを実現するため、「物理・設計・意図」の3つのスタンスを意識していきたいと思います。

    栗原氏:誰もが気軽に最先端のAIサービスを使えて、リアルなアバターもつくれるようになった今は、いわば社会全体で壮大な実験をしているような過渡期です。AIやロボットを“道具”として割り切って考える欧米と違って、“共生”を志向する日本は特徴的で、これまでにアトムやドラえもんのような愛されるロボット/AI作品が生まれてきたことにも必然性があると思います。

    人間の心や知能について考え続けてきた長い歴史と、「人間とAIの信頼関係の構築」をめぐる試行錯誤の蓄積を踏まえると、突き抜けて広く支持を集めるAIコンシェルジュサービスの登場まで、あともうほんの少しのところまで来ているのかもしれません。

    大澤氏:悩みごとを気軽に相談できるようなコンシェルジュ、さらに広くいえば信頼できる仲間、寄り添って支えてもらえるような存在が周囲におらず、苦しんでいる人たちはこの社会にたくさんいると思います。そういう方々に寄り添ってくれる、そしていろんな人がいろんな人に支えてもらえるような世の中になることを願っているので、その一歩になるような研究や開発をみんなで進めていけると良いですね。

    吉岡:生成AIによってリアリティを追求してきた『バーチャル・コンシェルジュ』ですが、人と信頼関係を築ける存在にしていくために今後何が必要か、大きなご示唆をいただきました。本日は、貴重なご助言をありがとうございました。

    ■関連動画のご案内
    「バーチャル・コンシェルジュ・ウェビナー アバター接客シリーズ」
    デジタルヒューマンと生成AIを融合し、相談業務のような高度なお客さま対応を行う『バーチャル・コンシェルジュ』。
    その実現を目指すワークショップをウェビナー形式で配信していますので是非ご覧ください。

    EVENT
    バーチャル・コンシェルジュ・ウェビナー アバター接客シリーズ 第一回 イントロダクション
    このたび、デジタルヒューマンと生成AIを融合し、相談業務のような高度なお客さま対応を行う『バーチャル・コンシェルジュ』の実現を目指すワークショップの一環として、シリーズ形式のウェビナーを立ち上げました。 (1)アバター接客によるビジュアルの高度化(2)生成AIによる対話の高度化、という2つの分科会の中で、ビジネス・技術の両面から実現可能性や課題を検討していきます。 アバター接客シリーズ初回の今回は、①ワークショップと分科会の概要②アバター接客の概要③NTTグループにおけるメタバースの取り組みについてお話しします。
    このたび、デジタルヒューマンと生成AIを融合し、相談業務のような高度なお客さま対応を行う『バーチャル・コンシェルジュ』の実現を目指すワークショップの一環として、シリーズ形式のウェビナーを立ち上げました。 (1)アバター接客によるビジュアルの高度化(2)生成AIによる対話の高度化、という2つの分科会の中で、ビジネス・技術の両面から実現可能性や課題を検討していきます。 アバター接客シリーズ初回の今回は、①ワークショップと分科会の概要②アバター接客の概要③NTTグループにおけるメタバースの取り組みについてお話しします。