人間とAI(その5)

對馬誠也理事長(以下、對馬):
 前回まで、日々進化している生成AIの現場の実情にどうやってついていこうかと、日々苦闘している遠藤さんの生活に関してお話していただきました(人間とAI(その4))。
 それでは、いよいよ「生成AIの最新情報」についてお話いただけないでしょうか。

遠藤隆也会員(以下、遠藤):
 まずは、生成AIを利活用に関して見ていきましょう。
 例えば、Google Geminiを利用して、「生成AIの最新情報」についてたずねると、下記の情報が得られます。
Google Geminiの回答:
 生成AI技術の最新情報について、2025年8月の最新動向を以下にまとめます。
 主要な技術トレンドとして、つぎのことがあげられます。
■ AIエージェントの台頭:
 これまでの生成AIは、人間の実行指示に基づいてタスクを行うものが主流ですが、最近では自律的に複数のタスクを実行できる「AIエージェント」が注目されています。Web操作やAPI連携、複雑なデータ処理などを自動化し、競合調査やマーケティング施策の立案といった業務を自律的に実行する強力なデジタルアシスタントとして活用が進んでいます。
■ マルチモーダルAIの進化:
 テキスト、画像、マルチ音声、動画など複数のデータ形式を統合的に理解・生成するモーダルAIがさらに進化しています。これにより、より人間らしい自然な対話や、リアルタイムでの映像・音声の同時処理が可能となり、自動運転車やインタラクティブな教材など、幅広い分野での応用が期待されています。GoogleのGemini 1.5 Proや、AMDのInstella-VL-1B、BaiduのERNIE 4.5などを代表するモデルとして挙げられます。
■ 大規模言語モデル(LLM)の進化:
・高性能化と多様化:OpenAIの「GPT-5」が提供を開始し、複雑なタスクを人間の専門家のように解決する能力を備えています。また、GPT-4oは対話の質とコストパフォーマンスのバランスが優れており、用途に応じたモデルの利用が重要になっています。
・ローカルAIと特化型AI:限られたリソースでな高性能モデルを動かせる「小型モデル(SLM)」や、特定の専門分野に特化したモデルも普及しており、プライバシー保護や専門性の高い業務での小型活用が進んでいます。

對馬:
 ありがとうございます。それでは、さっそく、それぞれの機能について教えてください。
 まず、「AIエージェント」の単語は最近よく聞きます。遠藤さんの説明では、これまでは「人間の指示に基づいてタスクを行っていた」のに対して、「自立的に複数のタスクを実行する」ものとのことですが、具体的にはどのようなことですか。
 具体的な例を出して教えていただけないでしょうか。

遠藤:
 AIエージェントは、ユーザーの指示を待たずに、自律的に状況を判断し、複数のタスクを連続して実行するAIシステムです。これは、従来のAIが単一の指示に対して一つのタスクをこなす「ツール」であったのに対し、AIエージェントは自ら目標を設定し、それを達成するために複数のステップを計画・実行する「協力者」のような存在です。
では、つぎにその具体例を従来のAIと比較してしましましょう。

■ 従来のAI(例:GPT-3.5):
 たとえば、旅行に行きたいと思い、「8月30日の東京から京都への新幹線のチケットを調べて」とAIに指示をだします。
 これに対してAIは8月30日の東京発京都行きの新幹線の時刻表と料金を提示します。この場合、新幹線のチケットを調べるという単一のタスクをAIに依頼し、AIはその指示に忠実に従います。もしホテルを探したければ、再度「京都で駅に近いホテルを調べて」といった別の指示を出す必要があります。

■ AIエージェント:
 AIエージェントは、ユーザーの最終的な目標だけを受け取ります。
 「来月の初めに東京から京都へ旅行に行きたいんだけど、計画を立ててくれない?」と指示を出したとすると、AIエージェントは自律的な行動して、その指示に対応します。
 まず、ユーザーの希望する旅行日程(来月の初め)を把握し、新幹線の空席状況を自動で検索します。
 つぎに、その期間のホテルの空室状況を複数の予約サイトで確認します。ここでは、ホテルの場所(例えば、京都駅周辺か、観光地に近いか)を考慮し、最適な候補を絞り込みます。
 さらに、旅行期間中の京都の天気予報や、おすすめの観光スポット、レストランを検索し、スケジュールを自動的に作成します。
 そして最後に、これらの情報を統合した、「新幹線の予約」、「ホテルの予約」、「旅程表」を提示し、「これで予約を進めますか?」とたずねてきます。

 このように、AIエージェントは「旅行の計画を立てる」という最終目標を達成するために、「新幹線の検索」、「ホテルの検索」、「観光情報の収集」、「スケジュールの作成」といった複数のタスクを自律的に連携させて実行するのです。ユーザーは初期の指示を出すだけで、複雑な一連の作業をAIエージェントに任せることができます。

 その他の利用例として、つぎのようなものがあげられます。
■ 業務自動化:
 営業担当者が「顧客A社の来週の商談の準備をして」と指示すると、AIエージェントは自動的に「A社の最新の株価」「競合の動向」「最近のプレスリリース」などの情報をウェブから収集し、それらを分析して報告書を作成する。
■ ソフトウェア開発:
 開発者が「ユーザー認証機能を実装して」と指示すると、AIエージェントは必要なコードを自動で生成し、テストを実行し、問題があれば修正を行う。
■ パーソナルアシスタント:
 ユーザーのスマートフォンの利用履歴から、「週末に友人とよくカフェに行く」、「新しいランニングシューズを探している」といった傾向を把握し、ユーザーが指示する前に「近所に新しくできたカフェがありますよ」、あるいは「お探しのランニングシューズのセール情報です」といった提案を自律的に行う。

 このように、AIエージェントは「何かをしてほしい」という指示に反応するだけでなく、「何をすべきか」を自ら考え、行動する次世代のAIとして注目されています。

對馬:
 ありがとうございます。従来のAIとAIエージェントの違いがとてもよくわかりました。AIエージェントがあると、従来、人間が行っていた作業を短時間で済ますことができるだけでなく、利用者が好む情報(新しいカフェ等)を提供するようにもなるのですね。遠藤さんが最近いつも言っている「エージェントAIシステムが人類の歴史を変える」という意味が分かってきました。職場によっては、これまで人間が何時間もかけて行っていた作業をエージェントAIが変わってきわめて短時間に行うようになるということですね。
 エージェントAIシステムの出現は、今後社会のあらゆる領域に多大な影響を及ぼすことは素人でも感じます。言い換えると、これからの時代を生き抜くためには、「エージェントAIシステム」について勉強し、必要に応じてそれを活用できるようにするスキルを持つことがとても重要だと思いました。

 さて、次回は、「大規模言語モデル(LLM)の進化」についてお聞きしたいと思います。