01
2025.07.18(Fri)
この記事の要約
AIエージェントが「デジタル同僚」となり一緒に働く時代が近づいています。AIエージェントは生成AIを中核とし、外部ツール、記憶機能、役割定義を組み合わせて目標達成に向けて自律的に行動するシステムです。コンテンツ生成に特化した生成AIとは異なり、「指示待ち型」から脱却しています。
NTTドコモビジネスは20種のAIエージェントを開発し、金融や製造業界で活用を進めています。効果的な活用には、業務の「暗黙知」を言語化するプロセスが不可欠です。人が無意識に行っている判断や、マニュアルに明文化されていないルールを一つひとつ明らかにし、AIに埋め込むことで、アウトプット品質の向上が期待できます。
今後は「AI中心の業務に人が入り込む」という可能性も視野に入れ、200種への拡張を目指します。AIエージェントと働く未来では、人だからこそ生み出せる創造的な価値の追求が、新たな競争力の源泉になると展望しています。
※この要約は生成AIをもとに作成しました。
――「生成AI」と「AIエージェント」の違いについて教えてください。
南葉潤一(以下、南葉):生成AIとは、大規模な学習データをもとに、主に確率的な推論にもとづいて自然言語や画像、動画、音声などのコンテンツを生成するAI(人工知能)を指します。一方、AIエージェントは生成AIを中核に据えつつ、外部ツールとの連携、記憶機能、役割定義などを組み合わせることで、目標指向型の行動を自律的に実行するソフトウェアシステムを指します。
生成AIとAIエージェントは、どちらもAIのカテゴリーに含まれますが、AIエージェントはその構成要素の1つとして生成AIを活用しています。コンテンツ生成や出力に特化した生成AIとは異なり、AIエージェントは生成AIの出力を利用して、目標達成に向けたさらなるアクションを行う点が大きな違いといえます。
――AIエージェントはどのような仕組みで成り立っているのでしょうか。
南葉:少しテクニカルな観点でAIエージェントの仕組みをひもとくと、大きく4つの要素で構成されています。
1つめは、頭脳に当たる「大規模言語モデル(LLM)」、つまり生成AIそのものです。生成AIによって、言語または非言語情報の処理・生成を行い、理解、推論、行動することができます。
2つめは、手足に当たる「ツール」です。一般的にFunction Calling、API、MCPサーバーといったツールを使うことで、外部情報にアクセスしたり、外部のデータやシステムを操作したりといったことが可能になります。
3つめは、記憶に当たる「メモリー」です。これにより、ユーザーとの過去のやり取りを参照してコンテキストを維持することで、パーソナライズされた応答を行うことができます。一般的には、短期記憶と長期記憶の種別に分けることができます。
4つめは、人格や役割に当たる「ロール」です。多くの場合は「プロンプト」や「インストラクション」として定義されますが、ロールによって、AIエージェントが果たすべき役割や期待される振る舞いを行うことができます。

OPEN HUB
THEME
Generative AI: The Game-Changer in Society
#生成AI