ブログ

技術的な学びや日々の気づきを記録しています。

AIAgentMicrosoft Agent FrameworkAgent HarnessC#.NETTools

同じ発想を Microsoft Agent Framework で — Agent Harness でツールを足すだけのレビューエージェントを作る

「オーケストレーションは委譲し、ツールを足すだけ」という発想は GitHub Copilot SDK だけのものではない。Microsoft Agent Framework の Agent Harness(HarnessAgent)は、計画・TODO・コンテキスト圧縮・ツール承認まで作り込まれた自律エージェントを 1 行で立ち上げ、あなたはツールを足すだけでよい。同じ文書レビューエージェントを C# で実装し、Copilot SDK 版との設計の違いを論じる。

AIAgentMemoryMicrosoft Agent FrameworkPythonC#LLM

エージェントの記憶を設計する — Microsoft Agent Framework で短期記憶・長期記憶を実装する実践ガイド

そもそも「記憶」とは何かを認知科学と最新の研究論文から体系立てて整理し、Microsoft Agent Framework の AgentSession・ContextProvider・ChatHistoryProvider を使って短期記憶と長期記憶を具体的に設計・実装する方法を、Python と C# のコードで徹底解説する。

Conversation UXLLM AgentEvaluationVoice AIDialogue SystemsLLM-as-JudgeHCI

会話 UX をどう測るか —— LLM エージェントと人間の対話を評価する、構造・内容・体験と決定論の地図

LLM をバックエンドに持つ会話エージェントの「会話 UX」を体系的に評価するフレームワーク。構造・内容・体験という分離可能な3つの品質軸に安全性の制約軸を加えてルールセットを MECE に分類し、決定論的に測れるもの/測れないものを切り分ける。テキストチャットと音声対話で評価軸の重みがどう変わるかを、ターンテイキングの認知科学まで掘り下げて論じる。

AIAgentGitHub CopilotSDKTypeScriptTools

オーケストレーションを手放す — GitHub Copilot SDK でツールを足すだけの文書レビューエージェントを作る

エージェントの「司令塔(オーケストレーション)」を自分で書くのをやめ、GitHub Copilot SDK に丸ごと任せてしまう。レビューに必要な処理をツールとして提供するだけでレビューエージェントが立ち上がる、という発想とその実装を、カスタムツール・権限制御・SSE サーバ・UI まで含めて解説する。この設計のメリットとデメリットも論じる。

AI AgentLLMClaude CodeArchitecturePaper ReadingMCPContext Engineering

本番 AI エージェントの設計空間を読む —— Claude Code 51万行の解剖から学ぶ、ハーネス中心設計の全貌

arXiv:2604.14228『Dive into Claude Code』を全面的に読み解く。while ループの周りに 98.4% の決定論的ハーネスを積み上げた設計思想を、安全性・文脈管理・拡張性・マルチエージェント・永続化の各軸で詳解し、AI エージェントの産業適用に向けた実践的な示唆を引き出す。