Copilot Studio 会話の添付ファイルを読み取るマルチモーダルなエージェント構築｜AI Buider

2025.04.18

前回の記事の続きで、会話の添付ファイルを読み取るマルチモーダルなエージェントをCopilot Studioで作ってみる。

前回はこちら。

Copilot Studio 会話に添付されたファイルを取得する｜Power Automate経由でSPOに保存

会話に添付されたファイルの内容を取得する方法を調べたのでメモ。やりたいことCopilotとの会話で添付したファイルを取得し、後のノードやPower Automateなどで使いたいときのお話。添付ファイルはChannelDataから取得可能S...

目次

やりたいこと
画像の解析は既に用意されている
構築
動作確認
関連記事

やりたいこと

会話に添付したファイルについて、AI Builder(GPT4o)を利用して質問したいときの話。

画像の解析は既に用意されている

実は画像の解析はプレビューだけど既に用意されている。

ただ、この機能は[生成AI]をONにする必要があり、今のところ日本語のCopilotでは使用できないため、今回はAI Builderと組み合わせて画像やPDFを読み取れるエージェントを作ってみる。

ユーザーからの画像入力と画像分析を許可する (プレビュー) - Microsoft Copilot Studio

Microsoft Copilot Studio エージェントが、ユーザーがエージェントとの会話中にアップロードした画像を分析できるようにします。

構築

今回も前回同様、最初の添付ファイルのみを対象とする。
※複数ファイルに対応したい場合はTable型として扱うか、Foreachを使用。

プロンプトアクション作成

[AIハブ]の[プロンプト]から新しいプロンプトを作成し、

適当なプロンプトと「画像またはドキュメント」入力を追加する。
※プロンプトの精度は未検証

以上でプロンプトアクションの作成は完了。

Power Automate構築

公式によると、この記事執筆時点ではCopilot Studioからのプロンプトアクション呼び出しで、「ファイル」形式の入力はまだ対応していないらしいので、Power Automateを経由する。

プロンプトにテキスト、画像、またはドキュメント入力を追加する

プロンプトにテキスト、画像、またはドキュメント入力を追加する方法を学習します。

引数にユーザーからのメッセージとデータ文字列を追加し、そのままAI Builderに渡すフローを構築。
このときデータ文字列はbase64ToBinary関数でバイナリ化すること。

あとは受け取ったメッセージを戻り値に設定して、Power Automateの構築は完了。

Copilot Studio構築

会話は「会話の強化（旧Conversation boosting）」で開始することにする。
※今回は単発の会話のみ想定。会話を複数回続ける場合は、別途検証が必要。

会話が始まったら、添付ファイルの数を取得し、

添付ファイルが存在する場合は専用のトピックにリダイレクトする。

リダイレクトしたトピックの中で、前回の記事の内容の通りcontentUrlを取得し、

Split関数とIndex関数でデータ部分を抽出する。

そしたら先ほど作成したPower Automateを追加し、ユーザーからのメッセージ（Activity.Text）とファイルのデータ部分を送る。

最後にPower Automateから戻ったメッセージを表示すれば構築は完了。

動作確認

まずは画像を送ってみると、無事ねこと判断してくれる。

2025/4/18時点でAI Builderのファイル入力の対象は「PNG、JPG、JPEG、PDF」らしいので、こんなPDFを作って、

質問してみると、無事答えてくれる。

もしExcelやPower Pointなども読み取れるようにしたい場合は、Document Intelligenceなどと組み合わせる必要あり。

関連記事

Copilot Studio 会話に添付されたファイルを取得する｜Power Automate経由でSPOに保存

会話に添付されたファイルの内容を取得する方法を調べたのでメモ。やりたいことCopilotとの会話で添付したファイルを取得し、後のノードやPower Automateなどで使いたいときのお話。添付ファイルはChannelDataから取得可能S...

Copilot Studio プロンプトアクション（AI Builder）の使い方を詳しく解説｜生成AIで回答を生成する

Copilot StudioからAI Builderの「プロンプト」を使用する方法について。Copilot Studioからの生成AIの利用Copilot Studioから簡単に生成AIを利用する方法として、以下2つが用意されている。生成...

Copilot Studio 「生成型の回答」ノードについて詳しく解説｜生成AIを利用して回答を生成する

Copilot Studioの中で生成AIを利用できる標準機能の一つ「生成型の回答」ノードを解説。Copilot Studioからの生成AIの利用Copilot Studioから簡単に生成AIを利用する方法として、以下2つが用意されている。...

Copilot Studio 計算式（Power Fx）の使い方とTips｜式の中で変数を使う方法、使える関数など

Copilot Studioの計算式の中からトピック変数やグローバル変数を使う方法について。計算式（Power Fx式）Copilot Studioでは色々なところ（質問する、変数を設定する、メッセージを送るなど）で、Power Apps...

Copilot Studio 会話の中でForeachループを使う｜テーブルや配列の操作に便利

Copilot Studioにおけるループについて調べていたらおもしろい記事を見つけたので紹介。会話の中でループを作る方法Copilot Studioにおいて、会話内のループを構築する場合は「手順に移動」ノードを使用していた。これはCとかの...

コメント

タイトルとURLをコピーしました