~/whoami

こんにちは、尾崎 耀一です

テクノロジーコンサルタント @ 日本マイクロソフト

技術ブログ、学んだこと、日々の記録を発信しています。

最新の記事

同じ発想を Microsoft Agent Framework で — Agent Harness でツールを足すだけのレビューエージェントを作る

「オーケストレーションは委譲し、ツールを足すだけ」という発想は GitHub Copilot SDK だけのものではない。Microsoft Agent Framework の Agent Harness(HarnessAgent)は、計画・TODO・コンテキスト圧縮・ツール承認まで作り込まれた自律エージェントを 1 行で立ち上げ、あなたはツールを足すだけでよい。同じ文書レビューエージェントを C# で実装し、Copilot SDK 版との設計の違いを論じる。

会話 UX をどう測るか —— LLM エージェントと人間の対話を評価する、構造・内容・体験と決定論の地図

LLM をバックエンドに持つ会話エージェントの「会話 UX」を体系的に評価するフレームワーク。構造・内容・体験という分離可能な3つの品質軸に安全性の制約軸を加えてルールセットを MECE に分類し、決定論的に測れるもの/測れないものを切り分ける。テキストチャットと音声対話で評価軸の重みがどう変わるかを、ターンテイキングの認知科学まで掘り下げて論じる。

すべての記事を見る