AIエージェントは、見知らぬ他人が書いたコードを実行するという行為を、後世の人々が理解に苦しむ行動の一つにしてしまうかもしれない。
社会はリスクを何十年もかけて正常化し、より安全なデフォルトが利用可能になった時点で、それを無謀な行為として再分類することがある。
飲酒運転、シートベルトなしでの乗車、屋内での喫煙、そしてインターネットから任意のバイナリをインストールすることは、すべて同じ歴史的な盲点の系譜に属する。共通点は社会的な許容である。
代替手段が高コスト、不便、または技術的に利用不可能である限り、その行動は続く。より安全な道が安価で日常的になると、古い道は不合理に見え始める。
AIエージェントの検証は、ソフトウェアの信頼前提を、証明された実行パス、より安全なデフォルト、ユーザー管理インフラに置き換える可能性がある。
現代のソフトウェアは、私たちがほとんど検査しない取引の上で動いている。開発者、企業、財団、または匿名のメンテナーがコードを書く。配布チャネルがそれをパッケージ化する。ユーザー、企業、またはオペレーティングシステムがそれを実行する。
セキュリティーはその後、その決断の結果を管理するための多層的な試みとなる。
パーミッション、コード署名、アプリストア、エンドポイント検出、サンドボックス化、ベンダーのデューデリジェンス、インシデント対応はすべて、核心的な行為が依然として危険であるために存在する:自分のマシン上で、自分のアカウント内で、自分のデータへのアクセスを持った状態で、他人の命令を実行すること。
その信頼モデルは機関規模において失敗してきた。SolarWindsの侵害は、信頼されたソフトウェアのビルドプロセスに挿入された悪意のあるコードが通常のアップデートを通じて配布され、政府機関、テクノロジー企業、通信ネットワーク、複数地域の他のターゲットに到達できることを示した。
運用上の教訓は構造的なものであり、攻撃対象領域はベンダー自身の正当性であった。
ビルドプロセスが侵害されると、通常の信頼のしるしが攻撃の配送インフラとなった。
同じパターンはXZ Utilsのバックドアにも現れた。CISAは2024年3月、Linuxディストリビューション全体に存在する圧縮ライブラリのバージョン5.6.0と5.6.1に悪意のあるコードが組み込まれていたと警告した。
国家脆弱性データベースはその後、偽装されたテストファイルとビルドプロセスの操作により、リンクされたソフトウェアのデータインタラクションを傍受・変更できる改ざんされたliblzmaライブラリが生成されたと説明した。
ソフトウェアサプライチェーンはユーザーからはるか上流で侵害され、その後ルーティンに見えるチャネルを通じて届く可能性がある。これは暗号業界でDNSやJavaScript npmのエクスプロイトとして何度も見てきた。
業界の対応はより強固なプロセスを追加することだった。NISTセキュアソフトウェア開発フレームワークは、リスクを低減してソフトウェアを構築・取得するための共通の実践セットを組織に提供する。
SLSAフレームワークは、来歴、完全性、改ざん耐性をアーティファクトパイプラインに組み込む。これらのコントロールは必要である。
しかしこれらは現在のモデルの限界も明らかにする。企業はどの外部コードが信頼に値するかを決定する方法を磨き続けている。
次のモデルは、そもそも信頼が必要な外部コードの量を減らす。
その変化はソフトウェアの社会的意味を変える。今日、第三者のコードはセキュリティーオーバーヘッドを伴う生産性資産として扱われる。
明日には、正当化を必要とする負債として扱われるかもしれない。デフォルトのユーザーの問いは「どのアプリをインストールすべきか?」から「私のエージェントが機能を構築できるのに、なぜ他人のアプリを実行すべきなのか?」へと移行する。
これは真の断裂線である。ソフトウェアは主に市場から選ばれる製品であることをやめ、ユーザー管理の実行環境内でオンデマンドで生成されるアウトプットとなる。
この進行方向はコーディングエージェントに見て取れる。OpenAI Codexは、複数のタスクを並行して処理できるクラウドベースのソフトウェアエンジニアリングエージェントとして導入された。
AnthropicによるClaude Codeは、コードベースをマッピングし、ファイルを変更し、テストを実行し、コミットされたコードを提供するエージェント型コーディングシステムである。
GitHubのCopilotコーディングエージェントは、同じパターンをGitHubのワークフローに取り込み、イシューやプルリクエストにわたる非同期作業を実現した。
Google Julesは同様の方向性を示す:製品コンテキストを吸収し、ソリューションを生成し、プルリクエストを送り出す自律型コーディングエージェントである。
これらの製品はまだ開発者ツールとして位置づけられている。その位置づけは時間とともに狭まっていくだろう。Codexにとってはすでにそうなっている。OpenAIは先月、コードやターミナルではなく「チャット」とアウトプットに焦点を当てたUIオプションを導入した。
より大きな変化は、ソフトウェアの作成が個人的な委任行為になりつつあることだ。ユーザーがワークフローを記述する。エージェントがインターフェース、ロジック、インテグレーション、テスト、実行パスを生成する。
そのアーティファクトは1時間、1週間、または1年続くかもしれない。再生成、フォーク、制約、監査、破棄、または新しいコンテキストのために再構築することができる。
アプリは永続的なオブジェクトというより、使用可能なインターフェースにコンパイルされたローカルポリシーのようなものになる。
これは信頼に対して即座の影響をもたらす。ユーザーは依然として他人のアプリケーションを観察するかもしれない。ワークフロー、インターフェースパターン、データスキーマ、プロンプト、オートメーション、サービスインテグレーションを検査するかもしれない。しかし観察は実行とは別のままでいられる。
ユーザーはそのアイデアをコピーし、そのユーザー自身のルールに支配された環境内で、個人エージェントに第一原理から機能を再構築するよう依頼できる。価値はコンパイルされたアーティファクトからパターンへと移行する。
配布は実行可能コードを出荷することよりも、意図、デザイン、プルーフ、スキーマ、API期待値を公開することについてのものになる。
暗号はブランディングではなく検証を通じて議論に入ってくる。ユーザーのエージェントは依然として外部サービスに接続する。
決済レール、アイデンティティシステム、マーケットデータエンドポイント、ストレージレイヤー、AIモデルプロバイダー、コンピュートマーケット、メッセージングシステム、コンプライアンスサービスを呼び出すかもしれない。信頼の境界はそれらのエンドポイントとそれらについてなされる主張に移行する。
ユーザーは、監査可能性、来歴、セキュリティーポスチャー、経済的整合性によって外部サービスをランク付けする方法を必要とするだろう。検証可能な環境内で構築されたサービスは、企業プラットフォームが管理するブラックボックスエンドポイントとは異なるスコアを得る。
プライベートなユーザー所有のAIエージェントと企業AIプラットフォームをソフトウェアインフラで比較した図。
ゼロ知識証明システムはそのランキングレイヤーへの一つの道を提供する。Zk-rollupは、計算をオフチェーンで実行しながら、簡潔なプルーフが結果として生じる状態遷移の有効性をオンチェーンで検証する方法を示している。
同じ概念的なパターンはトランザクションスケーリングを超えて拡張できる。ユーザーはエンドポイントが承認済みコードを実行したこと、定義された制約のもとでデータを処理したこと、プライバシー境界を保持したこと、または特定の監査済みビルドから結果を生成したことのプルーフを求めるかもしれない。
プルーフは内部の機密性を保ちながら、個人エージェントと外部依存関係の間の信頼ギャップを狭めることができる。
長期的なインターフェースはエージェント制御の操作レイヤーに似たものになるかもしれない。ユーザーはダッシュボード、ポートフォリオツール、リサーチアシスタント、パブリッシングシステム、個人CRM、会計ワークフロー、またはセキュリティーモニターを要求する。
エージェントは生成されたコードとランク付けされたエンドポイントからそれを組み立てる。コードはエージェントが作成したため検査可能である。
依存関係はエージェントがポリシーのもとで選択したため制約されている。実行環境はユーザーがそれを要件として選択したため監査可能である。
ユーザーは依然としてネットワーク化された経済に参加する。コントロールは個人により近いところに移る。
この移行の終点は、検証可能な機能、エージェントが生成したクライアント、ランク付けされた外部サービスの市場である。第三者開発者は依然として存在するが、その役割は変わる。
彼らはプロトコル、API、テンプレート、プルーフ、モデル、コンポーネント、リファレンス実装を公開する。ユーザーは自分自身のバージョンを実行する。
企業は依然として存在するが、その優位性は配布の管理から信頼性の証明へと移行する。オープンソースコミュニティは依然として存在するが、負担はユーザーにメンテナーを信頼するよう求めることから、エージェントに安全に再構築するための十分な構造化された材料を与えることへと移行する。
古いソフトウェア経済は完成したアプリケーションを販売した。新しい経済は信頼できる能力を販売する。
ポートフォリオトラッカーは、マーケットデータエンドポイント、ウォレットパーミッション、税務ロジック、レポートルール上に生成されたインターフェースになる。パブリッシングシステムは、アイデンティティ、編集、コンテンツ管理、アナリティクス、配布APIにわたる生成されたワークフローになる。
リサーチターミナルは、データベース、モデル呼び出し、来歴チェック、プライベートノートから生成されたサーフェスになる。いずれの場合も、ユーザーのエージェントがコンポジションを処理する。
外部世界は検証可能なリソースを提供する。その変化はすべてのインフラプロバイダーに商業的なテストも生み出す:主張を証明し、インターフェースを公開し、制約セットを露出させ、ユーザー側のエージェントがサービスが含まれるに値するかどうかを決定させる。
通常の議論は将来をローカル対クラウドとして組み立てる。その分類はインフラ問題の一部を捉えているが、政治経済を見逃している。
プライベートシステムはユーザー定義の制約のもとでクラウドコンピューティングを使用できる。企業システムはローカルで実行しながらも、アイデンティティ、インセンティブ、パーミッション、マネタイゼーションをベンダー管理のスタック内に閉じ込めることができる。
より持続的な分裂はプライベート対企業である。誰がアプリを定義するのか?
誰がアクセスできるものを決めるのか?誰がテレメトリーを受け取るのか?
誰がアップグレードパスを設定するのか?誰が機能を取り消せるのか?
誰がユーザーの依存から利益を得るのか?
エージェント型ソフトウェアが普通のユーザーにとって十分に安くなるにつれ、その分裂はより可視化されるだろう。一つの道は個人のソフトウェア主権へと向かう。
ユーザーは必要なツールを構築・再構築するエージェントを維持する。証明、コスト、信頼性、プライバシー、整合性に基づいてエンドポイントプロバイダーを選択する。
基礎となるワークフローを保ちながらインターフェースを放棄できる。あるエンドポイントから別のエンドポイントへ移行できる。
古いものが侵害、捕捉、または非効率になった時に新しいクライアントを生成できる。ユーザーが意図を所有し、エージェントが実装を再現できるため、ソフトウェアレイヤーはポータブルになる。
もう一つの道は管理された利便性へと向かう。企業プラットフォームは補助されたアプリ、統合されたアイデンティティ、クレジット、決済、ストレージ、AIアクセス、デフォルトワークフローを提供するだろう。
その一部は有用だろう。その一部は経済的に強制的だろう。
AI 駆動の豊かさが公的または私的なUBI隣接の収入スキーム、コンピュートクレジット、トークン配布、またはプラットフォーム連携の特典を生み出す場合、配布レールはソフトなロックインメカニズムになるかもしれない。ユーザーは、実行するソフトウェア、データの移動方法、どのエージェントが代理で行動できるかも定義するエコシステムを通じてサービスへのアクセスを受け取るかもしれない。
UBIレイヤーはその問題の最も敏感なバージョンである。Sam AltmanはAI時代の収入分配に関する議論と長く結びついており、Worldcoinは部分的に、パーソンフッドの証明とUBI的な配布の可能性を中心に組み立てられていた。
より広いポイントは一つのプロジェクトより大きい。経済的支援、本人確認、コンピュートアクセス、ソフトウェアパーミッションが収束する時、参加は自発的に見えながら条件付きになり得る。
ユーザーは理論上はオプトアウトする自由があるが、実際には管理されたアプリケーションレイヤーに向けて押し込まれるかもしれない。
利便性が主な戦場となる。企業スタックは低摩擦によってユーザーを獲得するだろう。
洗練されたデフォルト、即時アクセス、バンドルされたAI、社会的互換性、リカバリーフロー、コンプライアンスカバレッジ、報酬を提供するだろう。プライベートスタックはより難しいことで競争する必要がある:使いやすく感じる自律性。
技術的な管理を避けながら、より多くの責任を受け入れる理由をユーザーに与えなければならない。個人エージェントは決定的になる。なぜなら、以前は主権を非現実的にしていた複雑さを吸収できるからだ。
第一次リスクは、ユーザーがコストを理解する前に利便性のためにコントロールを取引することだ。第二次リスクは、その取引が補助され、正常化され、最終的に経済的生活へのアクセスに必要とされることだ。
企業アプリはバンドルされた特典を受け入れる人々のデフォルト環境になるかもしれない。プライベートに生成されたアプリは、ソフトウェアレイヤーを支払い、検証、設定、またはセルフカストディする意思のある人々のデフォルトになるかもしれない。
それは実行コントロールをめぐる新たな階級分裂を生み出す。問いは、エージェント型AIがその分裂を縮めるか深めるかだ。
その移行は不均一だろう。規制された分野はより遅く動くだろう。
企業はコンプライアンスの議論でアプリエコシステムを守るだろう。消費者はプライベートな代替手段が脆弱に感じる時、デフォルトの利便性を選び続けるだろう。
攻撃者はエージェント、プロンプト、依存関係の選択、モデルサプライチェーン、エンドポイントの証明をターゲットにするだろう。検証システムは、少数の認証局、クラウドプラットフォーム、またはモデルベンダーに捕捉されると、新たなチョークポイントを生み出すだろう。
個人のソフトウェア主権は、ユーザーが検査、移行、取り消しができない限り、別のブランド主張になり得る。
それでも、方向性は次のテストを定義するのに十分明確だ。問いは、自分自身のエージェントが必要なもののほとんどを構築できるようになった時、人々が主権よりも利便性を受け入れるかどうかだ。
今日、答えは概ねイエスである。なぜなら代替手段が依然として要求が高すぎるからだ。明日、答えはより不確実になる。
動作するアプリを生成し、そのパーミッションを制約し、依存関係を監査し、ランク付けされたエンドポイントのみに接続し、条件が変わった時に再構築できるユーザーは、企業のソフトウェアバンドルに対する本物の代替手段を持っている。
その代替手段は最初は奇妙に感じるだろう。その後、賢明に感じるだろう。
その後、金融、アイデンティティ、健康データ、プライベートコミュニケーション、リサーチ、またはビジネス業務を扱う誰にとってもデフォルトの期待になるかもしれない。不透明な第三者のコードを実行することは、利便性が支配する時、補助金が選択を歪める時、ユーザーが経済的アクセスと引き換えに管理された環境を受け入れる時に生き残るだろう。
エージェントがプライベートな生成を日常的にする場所では消えていくだろう。
社会的な再分類はゆっくりと、そして突然起こるだろう。新しいデフォルトが明らかになるまで、古い習慣は親しみ深いままだろう。
ユーザーが自分のエージェントにアプリケーションを構築させ、実行パスを検証し、証明済みのエンドポイントのみに接続できるようになると、説明の負担は逆転する。他人のコードを実行する人は理由を必要とするだろう。
エージェントを通じて構築する人は単により安全なデフォルトを使用しているだけだろう。しかし、マトリックスに接続し続ける人々に与えられる企業のインセンティブを逃すことを受け入れなければならないかもしれない。
AIエージェントがパーソナライズされた検証済みソフトウェアを構築するにつれて、アプリはすぐに印刷メディアと同じ死に直面するという投稿はCryptoSlateに最初に掲載された。

