回答を読む

ツール呼び出し、チャート、テーブル、引用 — Agent の言うことをどう信頼するか、間違っているときにどう押し返すか。

更新 2026-04-17

すべての Agent の答えはレシート付きの短いナレーションです。ナレーションは Agent が何が起きたと考えているか。レシート — ツール呼び出し、テーブル、チャート — は Agent が実際に何をしたか。何かを信頼するなら、レシートを信頼してください。

回答の解剖

reading · サンプルターン
たった今
Tablize
sql.query · orders joined with refunds, grouped by SKU 284 ms
python.analyze · outlier detection on margin 612 ms
3 つの SKU が今週、先週比で $8,420 のマージンを失いました。3 つすべて、火曜日に間違ったゾーンに行ったのと同じフルフィルメントバッチから出荷されています。
SKU商品マージン Δ
SKU-1047Oat Milk 1L−$4,120
SKU-0912Cold Brew−$2,640
SKU-2238Matcha 50g−$1,660
これはカタログの問題ではありません — カタログの他の 42 SKU は横ばいかプラス。この出荷に特化した問題です。
· 典型的な Agent ターン — ナレーション、ツール呼び出し、データ、解釈

画面上には 5 つの要素があります:

  • ツール呼び出し行(グレー、モノフォント) — 各行がツール名、一行説明、所要時間を表示。
  • ナレーション — Agent がデータから読み取ったと考える内容。
  • データレンダリング — テーブル、チャート、マップ。スクショではなくライブマークアップ。
  • 太字の主張 — Agent は「これだけは持ち帰るべき」という 1 点を太字にします。
  • 解釈 — データの後の文章で、なぜそれが重要かを説明。

読む順序: ツール呼び出し → データ → ナレーション。逆ではありません。ナレーションは間違うことがあるが、データは通常そうではありません。

ツール呼び出し

各ツール呼び出しは次を表示します:

✓ tool_name · 一行説明 · 所要時間
  • は成功。 は失敗 — Agent は通常リカバーして再試行しますが、失敗行はクリックする価値があります。
  • tool_name は呼び出しが属するドメインを示します(sql.querypython.analyzeapp.createwatch.createfetch.get など)。
  • 説明は Agent が達成しようとしたことであって、生の引数ではありません。
  • 任意の行をクリックすると展開されます: 実行された正確なクエリ/コード/ペイロードと、Agent が解釈する前の生の結果が見られます。

編集可能: 行が展開されると、クエリを変更して再実行できます。Agent は新しい結果を後続のナレーションで使います。

データレンダリング

Agent が使う 3 つの形:

  • テーブル — 答えが行のとき。カラムでソート可能、CSV エクスポート可能。
  • チャート — 比較なら棒、時系列なら線、分解ならスモールマルチプル。すべてライブマークアップ — 任意のズームでクリア、テーマ対応。
  • KPI カード — 1 つの数字の答えに。大きな値、小さなデルタ、下にコンテキスト。

頼めばレンダリングを変えられます: 「これを線グラフで」「これをテーブルに展開して」。Agent はクエリを再実行せずに要求を尊重します。

引用と出所

良いデータ衛生はすべての数字にソースがあることを意味します。Agent は自動で追跡します。

  • ナレーションの数字にホバー — どのツール呼び出しが生んだか小さなツールチップで表示。
  • 「クエリを見せて」 — いつでも、どのターンでも。Agent が関連するツール呼び出しをインラインで開きます。
  • 出所付きでコピー — テーブルのクリップボードコピーは、行 + 生成に使った SQL のコメントブロックを一緒にコピーします。

これは Report を書いていたり、結果を共有ドキュメントに貼ったりするときに最も重要です。ソース可能な数字は信頼可能な数字です。

Agent が不確実性をフラグするとき

Agent はわからないと言うのを恥ずかしがりません:

  • 「ここでデータが矛盾しています。」 — 通常はタイムゾーンか重複。ツール呼び出しをクリック。
  • 「これはサンプルベースです — 全データセットで実行しますか?」 — 非常に大きなテーブルで起きます。サンプルの結論が重要なら yes。
  • 以降のデータしか見えません。」 — 統合またはアップロード境界。Agent は欠けているものを捏造しません。
  • 「この 2 つのデータソースが食い違っています。」 — GA4 vs Stripe の売上、webhook vs 統合でよくあること。Agent はギャップを浮かび上がらせ、両方の数字を提示します。

これらを真剣に受け取ってください。Agent が正しいことをしているサインです。

押し返す

Agent が間違っていると思うとき:

  • 「正しくないように見える」 — Agent に再チェックを頼みます。より狭いサニティクエリで再実行します。
  • 既知の正しい値を与える。 「先週の売上は $42K だった、$38K ではない — 差を追跡して。」 Agent はギャップをトレースします。
  • 手法を問う。 「これは同じものを比較していますか? 先週は営業日が 1 日多かった。」 Agent は調整して再実行します。

これは失礼ではありません。これが 1 セッション内で Agent が改善する方法です。

いつ自分で SQL を確認すべきか

すべてのクエリを読む必要はありませんが、他の人と共有しようとしている答えについては、30 秒 SQL を読むのは安い保険です。

注目点:

  • 行を爆発させる JOIN。 非一意キーへの LEFT JOIN は売上を重複させます。
  • 欠けたフィルタ。 updated_at > now() - interval '7 days' は正しい、フィルタなしは間違い。
  • 間違った集計。 AVG(price) vs SUM(price) / COUNT(*) — 通常同じ、時々違う(NULL の扱いが異なる)。
  • タイムゾーンドリフト。 結果の日付が 1 日ずれていれば、Agent が UTC を使っていてデータがローカル時刻の可能性大。

おかしいものを見つけたら、その場で SQL を編集できます。Agent が再実行してナレーションを更新します。

答えをエクスポート

すべての答えはエクスポート可能です:

  • コピー — ナレーションとデータをコピー。
  • Report として保存 — ナレーション + チャートが Markdown ページに。Reports を参照。
  • CSV ダウンロード — テーブルデータのみ。
  • スクリーンショット — 回答パネルはスクショに優しい。OS のツールを使ってください。
  • ターンへのリンク — 各ターンには安定 URL があります。Slack に貼ってチームメイトにこの答えを正確に見せられます。

次のステップ

  • 質問する — ループのもう半分。
  • Split ビューと Artifact — 答えがチャットに大きすぎるときに何が起きるか。
  • Reports — この答えを後で(自分やチームメイトが)再読できるものに変える。