Partnership with Robots

2020.01.01(Wed)

生成AIとは?
主なサービスとメリット・課題点、利用時のガイドライン

#AI #データ利活用 #イノベーション
一過性のブームを超え、ビジネス界においてその真価が認められつつある生成AI。単純作業を自動化できる従来のAIとは異なり、より人間に近いクリエイティブな作業を任せられるのが特徴です。あらゆるビジネスのゲームチェンジャーになる可能性を秘めているため、早い段階で生成AIのメカニズムや導入効果を理解しておくことが重要になります。

そこで本記事では、生成AIに関する基本的な知識や主なサービス、利用のメリット、課題点を解説します。利用時のガイドラインもご紹介しますので、生成AIの理解を深める際にお役立てください。

生成AIの基礎知識

生成AIは、現代社会における新たな価値創造のキーテクノロジーとして注目されています。ここでは、生成AIの基本的な仕組みやビジネス活用事例、従来のAIとの違いなどを解説します。

●生成AI(ジェネレーティブAI)とは?*1
生成AIとは、テキストや画像などの多様なコンテンツを創造する能力を備えたAI(人工知能)のことです。ジェネレーティブAIや生成系AIとも呼ばれます。ディープラーニング(深層学習)と呼ばれる機械学習の手法を用いて、人間から与えられたデータのパターンや関係を学習するだけでなく、新たに学習用のデータを与えなくても自ら学習し続けるため、人間の予測の範囲を超えた新たなコンテンツを生成することができます。ディープラーニングとは、人間が回答を用意して記憶させる「教師あり学習」と異なり、コンピューターが自ら学習するデータ分析手法です。

登場して間もない技術のようなイメージがある生成AIですが、実際には多くの国や企業がさまざまな分野ですでにこの技術を取り入れています。例えば、ビジネス文書の自動作成やマーケティングにおける需要予測など、用途は業界・業種によって多種多様です。また、2023年9月には、NTTグループがイスラエルのスタートアップ企業D-IDとの協業に関する覚書に署名。メタバースと対話式の生成AIを組み合わせる技術を持つD-IDと共同でサービス開発を進めることを発表するなど、国境を越えた活用も進んでいます。

●生成AIが持つ可能性
生成AIは他の先進技術と組み合わせることで、多くの可能性が指摘されています。

日立製作所では、メタバース空間に駅や線路を再現してAIが何らかの異常を検知したら表示する研究を行っており、保守作業の効率化が見込まれています。メタバース上で確認できるため、リモートでの保守作業や、シミュレーションによる新人研修のトレーニングへの活用も期待されています。

また、NFTと組み合わせることで、生成AIで作り出したコンテンツを取引することも可能になります。もちろんメタバース空間でやりとりできるようになるため、新たなビジネスモデルを生み出すことになるでしょう。

●生成AIの仕組み
生成AIには主に2つのタイプがあります。

1つ目は、テキストボックスに要望や質問などのプロンプトを入力するタイプです。コンピューターが入力内容を解析して、適切な回答やコンテンツを生成します。人間の言語を理解し、解釈するために設計されたコンピューターアルゴリズムを「自然言語処理モデル」と呼びます、そのうち大量のテキストデータを使って訓練したものが「大規模言語モデル(LLM)」で、一般的に対話式の生成AIに用いられているのはLLMです。国内でも2023年11月に、NTTが独自開発のLLM「tsuzumi」を発表し、注目が集まっています。

2つ目は、画像などの学習データを大量に読み込ませるタイプです。大量の学習データから共通する特徴を抽出し、新しい画像などのコンテンツを生成します。

●生成AIと従来のAIの違い*2
従来のAIの多くは、正しい規格を学習させ、それに合致するか否かを識別できるようにしたものです。識別系AIと呼ばれ、情報の整理や分類、検索、特定などのタスクに長けており、作業の自動化に役立ちます。顧客からの簡単な問い合わせに定型文で対応する、カスタマーサポートの自動応答システムなどが代表例です。

一方、生成AIは新しいコンテンツを創造する能力を持っており、構造化されていないデータセットを基に学習します。例えば、生成AIで進化したチャットボットは、顧客からの問い合わせの文脈を理解し、定型文での回答が用意されていない場合でも自ら回答を生成できるようになります。生成AIの登場は、新たなツールの誕生だけではなく、既存ツールに柔軟性や創造性をもたらすきっかけにもなり得るでしょう。

*1-1 https://www.atpartners.co.jp/ja/news/2023-09-06-japan-and-israel-strengthen-business-ties
*1-2 https://www3.nhk.or.jp/news/html/20230417/k10014040781000.html
*1-3 https://mirai-works.co.jp/business-pro/generative-ai-case-study
*2 https://xtech.nikkei.com/atcl/nxt/column/18/02596/092600001/

生成AIの主な種類と代表的なサービス

生成AIには、できることに応じていくつかの種類があります。そこで続いては、生成AIの主な種類と代表的なサービスをご紹介します。

●テキスト生成AI
テキスト生成AIは、ユーザーがテキストボックスに質問を入力すると、適切な回答を生成するタイプのAIです。使用する言語モデルによって精度は異なりますが、応用範囲が広いのが特徴です。例えば、プログラミングのコード生成やエラー診断、長文の要約、キャッチコピーの創出、さらには音声データからの文字の書き起こしまで行えるものもあります。ビジネス文書の自動作成や教育分野での学習支援など、さまざまなシーンで活用されています。

・ChatGPT*3
ChatGPTは、大規模言語処理モデルの一種であるGPTを組み込んだテキスト生成AIです。OpenAI社が提供しています。ChatGPT では2023年9月現在、無料版にはGPT-3.5、有料版(ChatGPT Plus)にはGPT-4が搭載されています。

ChatGPTは、インターネット上の膨大な文書から学習を行っており、その知識を基に質問に対して適切な回答を生成します。また、質問と同時にデータを入力することで、文章の要約や社内文書の検索など、特定のタスクを実行させることも可能です。加えて、ChatGPTはテキスト生成AIブームの火付け役であり、ChatGPT APIを活用して多様なサービスやアプリケーションが開発されています。

・Bard*4
Bardは、Google社によって開発されたテキスト生成AIで、大規模言語モデルのPaLM2を採用しています。長文の要約や定型文の作成、翻訳などのタスクを実行できます。

BardはGoogle検索と連携しているのが特徴です。ユーザーが質問をすると、Google検索結果から得られる情報を基に回答を生成します。ChatGPTは特定の期日までの情報に基づいて回答を生成するため情報が古くなることもありますが、Bardの場合はリアルタイムでの学習を行い、最新情報に基づいた回答を提供できるのが強みです。

・Catchy*5
Catchyは、OpenAIのGPT-3を利用したテキスト生成AIです。ライティングサポートに特化したツールであり、キーワードやテーマを指定するだけでブログ記事やメール、キャッチコピーなど、さまざまな種類の文章を生成してくれます。

●画像生成AI*6
画像生成AIは、ユーザーが入力したテキストや画像に基づいて新しい画像を生成するタイプのAIです。例えば、「男の子、勉強」という情報を与えると、勉強をしている男の子の画像が出力されます。「実写」や「アニメ」などのテイストや、「学校」や「夕陽」などのシーンを細かく指定することで、より精度の高い画像を生成することが可能です。

・DALL・E 2*7
DALL・E 2は、OpenAI社が開発した画像生成AIです。テキストからの画像生成や作成した画像のバリエーション生成、画像の編集、背景の生成などの機能を搭載しています。

なお、2023年9月には最新版のDALL・E 3がChatGPTに追加されました。これにより、ChatGPTの有料版を利用している場合は、DALL・E 2でクレジットを購入していなくても画像生成を行えます。

・Midjourney*8
Midjourneyは、同名のアメリカ企業が提供している画像生成AIです。コミュニケーションアプリのDiscordでテキストを入力すると、AIが自動的に画像を生成してくれます。カスタマイズ性にも優れており、ボタン1つで、生成された画像とは別のテイストやバリエーションの画像を出力することも可能です。

・Stable Diffusion*9
Stable Diffusionは、Stability AI社が開発した画像生成AIです。基本的な機能はDALL・E 2やMidjourneyと変わりませんが、無料で利用できるのが特徴です。Web版にアクセス、もしくは自身のPC内にローカル環境を構築することで、Stable Diffusionを利用できるようになります。ただし、Web版は一部機能が有料となっている場合があり、ローカル版はPCに一定のスペックが求められるため注意しましょう。

●動画生成AI*10
動画生成AIは、テキストや画像データからオリジナルの動画コンテンツを生成するタイプのAIです。動画に合わせたテロップの自動生成や、動画構成の提案ができるものもあります。

・Pictory*11
Pictoryは、テキストや記事から動画を作成できる動画生成AIです。テキストを入力したり、記事のURLを貼り付けたりするだけで動画が生成されます。テキストを使った動画編集やテロップの自動生成機能も搭載しているため、編集に関する複雑な知識は必要ありません。

・FlexClip*12
FlexClipは、Webブラウザ上で利用できる動画編集サービスです。AIを使った動画生成機能が追加され、テキストもしくは記事のURLを入力することで、自動で動画を生成できるようになりました。生成された動画をそのまま編集することもでき、動画配信サイトやSNSなど、アップロードする媒体に合わせたテイストにカスタマイズできます。

●音声生成AI*13
音声生成AIは、入力されたテキストを自然な音声へと変換する生成AIです。人の声を入力することで声質などを再現できるサービスも登場しており、ナレーションやカスタマーサービスなどでの活用が期待されています。

・VOICEVOX*14
VOICEVOXは、入力されたテキストを音声に変換する音声合成ソフトです。ソフト内には複数のキャラクターと声質が用意されており、それらを指定してテキストを入力するとキャラクターが文章を読み上げてくれます。話速や抑揚を調整することもでき、より自然な音声に仕上げられます。また、VOICEVOXはオープンソース・ソフトウェアのため、プログラミングの知識があれば自分好みにカスタマイズすることが可能です。

・CoeFont*15
CoeFontは、Webブラウザ上で利用できる音声合成サービスです。テキストを入力すると、オリジナルキャラクターやアナウンサー、著名人などが文章を読み上げてくれます。自分の声をコンピューター音声として登録して利用することも可能です。また、多言語対応も進めており、2023年9月時点では英語や中国語のテキストをネイティブの発音で音声化したり、日本語の音声を英語や中国語に変換したりできます。

*3-1 https://atmarkit.itmedia.co.jp/ait/articles/2303/13/news013.html
*3-2 https://x.gd/9Gif4
*4-1 https://mechalog.com/bard-lamdapalm2
*4-2 https://www.profuture.co.jp/mk/column/54733
*4-3 https://products.sint.co.jp/topsic/blog/google-bard
*5-1 https://lp.ai-copywriter.jp/#Pricing
*5-2 https://x.gd/ORO0A
*6 https://www.trans.co.jp/column/knowledge/ai_image_generator/
*7-1 https://www.sedesign.co.jp/dxinsight/dall-e2
*7-2 https://tcd-theme.com/2023/11/dall-e-2.html
*8-1 https://xrcloud.jp/blog/articles/business/10267/
*8-2 https://fotographer.ai/generative_ai_mag/005
*8-3 https://kigyolog.com/article.php?id=1690
*9-1 https://www.sungrove.co.jp/stable-diffusion-how-to-use
*9-2 https://x.gd/kQ00n
*9-3 https://aismiley.co.jp/ai_news/what-is-stable-diffusion/
*10-1 https://xrcloud.jp/blog/articles/business/11760/
*10-2 https://mo-la.jp/digital/85157/
*11-1 https://ai-database.net/posts/pictory
*11-2 https://x.gd/ZnEVt
*11-3 https://funrepeat.com/fr-note/3262
*12 https://www.flexclip.com/jp/tools/ai-text-to-video/
*13-1 https://www.sbbit.jp/article/cont1/121524
*13-2 https://x.gd/VLrNN
*14-1 https://dic.pixiv.net/a/VOICEVOX
*14-2 https://pc.watch.impress.co.jp/docs/topic/feature/1403379.html
*15 https://coefont.cloud/

生成AIに用いられる主なモデル

生成AIには、従来のAIから大幅に進化したモデルが使用されています。こちらでは、生成AIに用いられる主なモデルを解説します。

●GPT
GPT(Generative Pre-trained Transformer)は、OpenAI社が開発した自然言語処理モデルです。与えられたプロンプトに対して、文脈に合った精度の高いテキストを生成することができます。GPT-3からGPT-3.5、GPT-4へとバージョンアップが進むにつれて、精度は大幅に高まっています。また、膨大なテキストデータを学習し、単語の次に記述される可能性の高い単語の候補を高い精度で予測できるようになりました。

さらに、GPT4からテキストだけでなく、画像や音声などのフォーマットも入力できるようになったのが特徴です。GPT-4の言語処理精度は高く、アメリカの司法試験に合格できるほどとされます。

●VAE*16
VAE(Variational Auto-Encoder)は、主に画像生成AIの基盤となっている生成モデルです。「大きい」「小さい」などの主観的情報である潜在変数をできる限り数値化することで、与えられた画像データと似た特徴を持った画像を生成します。

●GAN*17
GAN(Generative Adversarial Network)は、「敵対性生成ネットワーク」とも呼ばれ、VAEと同様に画像生成AIで使用される生成モデルです。2つのニューラルネットワークが互いに競い合うことで、高品質な画像を生成する仕組みです。具体的には、一方のネットワークがランダムにデータを生成し、もう一方が生成されたデータと与えられた画像データとの整合性を識別します。このプロセスを繰り返すことで、両ネットワークの学習が進み、高精度な画像が生成されるようになります。

●拡散モデル*18
拡散モデルは、MidjourneyやStable Diffusionに採用されている生成モデルです。学習用の画像データにノイズを追加し、それを取り除く過程で画像の生成プロセスを学習します。ノイズ除去後の画像が元の画像に近くなるように学習を繰り返すことで、より高精度な画像を生成できるようになる仕組みです。基本的に画像生成AIには、拡散モデルの他に、画像とテキストの関連性の高さを判定するモデルも組み込まれています。そのため、人間側のテキストによる条件付けが可能になっています。

*16-1 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/#lwptoc25
*16-2 https://www.tryeting.jp/column/2382/
*17-1 https://mynavi-agent.jp/dainishinsotsu/canvas/2023/05/post-976.html#title6
*17-2 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/#lwptoc25
*18-1 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/#lwptoc25
*18-2 https://mynavi-agent.jp/dainishinsotsu/canvas/2023/05/post-976.html#title6

生成AIを活用する主なメリット

生成AIは、すでにさまざまな分野や業務で活用が進んでいます。続いては、生成AIを活用する主なメリットをご紹介します。

●生産性の向上
生成AIを活用すると、一部のアウトプット業務を生成AIに依頼できるため、業務時間の削減や業務効率化に役立ち、生産性の向上が期待できます。具体的には、議事録の作成や会話の文字起こし、ビジネスメールの作成、コードのデバッグ、業務マニュアルの作成、SEO記事のタイトル・見出し作成、文字数を指定した文章の作成などを任せられます。うまくプロンプトによる指示を出せるようになれば工数削減につながるでしょう。

●人手不足への対応*19
生成AIの活用によって、人的資源を必要とする作業の一部を自動化できるため、人手不足に対応しやすいのもメリットと言えます。特に日本は少子高齢化が進んでおり、内閣府の発表によれば2065年の生産年齢人口は2020年時点の約4割減となる見込みです。人手不足の対策として、生成AIによる人間の稼働工数削減は重要になります。

●顧客満足度の向上*20
生成AIを取り入れることで、顧客の行動を学習してパーソナライズ化した対応ができるようになるため、顧客満足度の向上が期待できます。顧客の嗜好が細分化され、ターゲットマーケティングの重要性が増している現代では、生成AIによって個々のユーザーの情報を学習・分析する必要性が高まっています。

●クリエイティブ業務の補助*21
生成AIは、アイデアを大量かつ迅速に作成できるため、クリエイティブ業務の補助にも役立ちます。人間よりも多くのアイデアを、テキストや画像、映像、音声などさまざまな形でアウトプットできるのが魅力です。生成AIが作成したアイデアをクリエイターがブラッシュアップすることで、より革新的な作品を生み出しやすくなるでしょう。

*19 https://www.softbank.jp/biz/solutions/generative-ai/
*20-1 https://growth-marketing.jp/knowledge/moengage-generative-ai/
*20-2 https://www.softbank.jp/biz/solutions/generative-ai/
*21-1 https://www.softbank.jp/biz/solutions/generative-ai/
*21-2 https://www.salesforce.com/jp/resources/articles/business/generative-ai/

生成AIの主な課題点

生成AIの性能は日々向上しており、今後もさまざまな分野での活用が期待されていますが、使い方によっては一定のリスクをともなう場合があります。ここでは、生成AIを使用するうえでの問題点を解説します。

●真実ではない回答を行うおそれがある*22
生成AIは膨大なデータを基に学習していますが、必ずしも正しい回答を返すとは限りません。学習元のインターネット上の情報が正確とは限らないためです。関連性の高い言葉を予測して文章を生成する仕組みのため、事実とは大きく異なる記述となるおそれがあります。

生成AIが虚偽の情報を生成する現象を「ハルシネーション」と呼びます。AIが幻を見て回答を生成しているかのように見えることから、幻覚を意味するこの名称が付けられました。虚偽の情報からコンテンツを作成することを防ぐには、専門家によるファクトチェックが必要になる場合があります。

●著作権に抵触するおそれがある*23
生成AIは、既存のコンテンツを学習して新たなコンテンツを生成するため、著作権に抵触するおそれがあります。例えば、画像生成AIの場合、完成した画像が学習元となったイラストレーターの絵柄やタッチと類似してしまい、トラブルになるケースがあります。

●情報漏洩のおそれがある*24
生成AIを利用する場合、情報漏洩にも注意が必要です。例えば、ChatGPTの場合、インターネット上の情報に加えて、ユーザーからの質問や生成した回答を蓄積・学習しています。そのため、ChatGPTに個人情報や企業の機密情報を入力してしまうと、データベースにその情報が記録され、ほかのユーザーへの回答として出力される可能性があります。生成AIを適切に利用するには、ユーザー側のリテラシーを高めることも重要です。

●サイバー攻撃に悪用されるおそれがある*25
生成AIは、サイバー攻撃への悪用も懸念されています。生成AIを活用することで、文章や画像、動画などのコンテンツを極めてリアルに作成することが可能になるためです。その結果、従来の方法では本物と偽物を区別できなくなり、詐欺や偽情報の拡散などの被害が増加するリスクがあります。実際、アメリカでは音声生成AIを使って家族や知人の声を合成し、現金をだまし取る詐欺が発生しているようです。

●法整備が追い付かないことがある*26
生成AIに関しては、法整備が追い付いていないのが現状です。生成AIの運用には、生成AI自体の法的な位置付けや学習データの取り扱い、生成されたデータの著作権など、さまざまな法的論点が存在します。日本でも著作権法改正などの声はあがっているものの、AIの利活用を直接規律する法律は制定されておらず、今後さらに議論が活発化すると予想されます。生成AIをビジネスに取り入れる場合は、こうした国の動きも注視する必要があるでしょう。

●生成できないコンテンツがある*27
生成AIは多くの分野で有用ですが、すべてのコンテンツを生成する能力があるわけではありません。特に、複雑な感情を表現する内容や深い知識が要求される分野では、AIによるコンテンツ生成が困難な場合があります。

例えば、画像生成AIの場合、「泣いている人の画像」を作成することは可能ですが、「大切な人を失った人の気持ち」を画像にすることはできません。生成AIには感情を理解して表現する能力がないためです。そのため、生成AIを使用する場合は、ユーザー側が生成AIにとって理解しやすいプロンプトを用意する必要があります。

*22-1  https://www.salesforce.com/jp/resources/articles/business/generative-ai/
*22-2 https://atmarkit.itmedia.co.jp/ait/articles/2303/30/news027.html
*23-1  https://mynavi-agent.jp/dainishinsotsu/canvas/2023/05/post-976.html#title6
*23-2 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/
*24-1 https://www.lanscope.jp/blogs/it_asset_management_emcloud_blog/20230627_31798/
*24-2 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/
*25-1 https://japan.zdnet.com/article/35211425/
*25-2 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/
*26-1 https://www.businesslawyers.jp/articles/1314
*26-2 https://www.nikkei.com/article/DGXZQOUA26BA20W3A021C2000000/
*27 https://www.brainpad.co.jp/doors/news_trend/about_generative_ai/

生成AIの利用に関する主なガイドライン

生成AIの社会的インパクトや重要性を踏まえて、2023年10月、岸田総理大臣は「科学技術と人類の未来に関する国際フォーラム」において、生成AIのルール作りで日本が主導的な役割を果たしていく意思を表明しました。ここでは、そうしたルール作りの第一歩となる、生成AIの利用に関する主なガイドラインをご紹介します。

●一般社団法人日本ディープラーニング協会「生成AIの利用ガイドライン」
こちらの協会では、生成AIを活用したい組織がスムーズに導入できるよう、利用ガイドラインの雛型を公開しています。誰でも無料でダウンロードでき、適宜、必要な追加や修正を加えて利用できます。生成AIの主な課題点を考慮したうえで作成されているのが特徴です。

現在ダウンロードできるのは2023年10月公開の第1.1版となっています。条項だけをまとめたものと、簡易的な解説を付したものの2種類に分かれているため、必要に応じて使い分けましょう。

出典:「生成AIの利用ガイドライン」(一般社団法人日本ディープラーニング協会)

●文部科学省「初等中等教育段階における生成AIの利用に関する暫定的なガイドライン」
こちらは、教育現場における生成AIの活用の適否を判断するための参考資料として、国がまとめたガイドラインです。教育現場での生成AIの活用方法や注意点などが掲載されています。なお、このガイドラインは2023年6月末時点の情報から作成されたものであり、今後内容が変更される可能性があります。

出典:「初等中等教育段階における生成AIの利用に関する暫定的なガイドライン」(文部科学省)

●東京都デジタルサービス局「文章生成AI利活用ガイドライン」
こちらは、東京都の職員向けに策定された、文章生成AIの利活用に関するガイドラインです。業務に文章生成AIを正しく導入することで、行政サービスの質を向上させることを目的としています。文章生成AIの特徴や利用環境、利用上のルール、活用方法などが掲載されています。

出典:「文章生成AI利活用ガイドライン」(東京都デジタルサービス局)

生成AIが得意なことを理解して導入効果を最大化しよう

ここまで、生成AIの概要や種類、利用のメリット、注意点などをお伝えしました。生成AIは、テキストや画像、動画、音声といった多種多様なデジタルコンテンツの自動生成を可能にする技術です。有効活用することで、自社の業務効率を飛躍的に向上させたり、クリエイティブな業務にリソースを注力したりすることが可能になります。

一方で、セキュリティ上のリスクやAIが生成できないコンテンツもあり、すべての業務を生成AIが代替できるわけではありません。生成AIの得意・不得意を正しく理解し、人が行うべき業務との棲み分けを行うことで、導入効果を最大化できるでしょう。

合わせて読みたい:
OPENHUB内のAI関連記事