OpenAI 與能源部實驗室合作,將聯邦許可時間縮短 15%
Tony Kim 2026 年 3 月 4 日 17:29
OpenAI 與太平洋西北國家實驗室推出 DraftNEPABench,顯示 AI 代理可在聯邦環境審查中為每個小節節省 1-5 小時。
OpenAI 與美國能源部的太平洋西北國家實驗室開發了一個基準測試,顯示 AI 編碼代理可將聯邦環境許可草案時間降低了高達 15%。這項於 2026 年 2 月 26 日宣布的合作產生了 DraftNEPABench——一個測試框架,評估了來自 18 個聯邦機構的 102 項起草任務中的 AI 表現。
該基準測試專門針對國家環境政策法工作流程,這是一個有 50 年歷史的流程,要求聯邦機構在批准發電廠、橋梁和製造設施等基礎設施專案之前記錄環境影響。這些審查通常需要數年時間,並涉及數百頁的技術報告。
測試顯示的結果
19 位 NEPA 主題專家以 1-5 分的評分標準評估 AI 生成的草案,衡量結構、清晰度、準確性和正確的引用使用。這些代理——在 OpenAI 的 Codex CLI 上運行,搭配 GPT-5——展示了每個文件小節可節省 1-5 小時的潛力。
這聽起來並不戲劇化,直到你考慮到規模。環境影響聲明包含數十個小節,每個小節都需要交叉引用技術報告、法規要求和多個數據來源。在目前需要數月或數年才能通過的專案中,每個小節節省幾個小時會迅速累積。
AI 代理被要求閱讀和綜合數百頁的文件,驗證環境和法規來源的事實,並產生符合特定法律標準的結構化報告。任務涵蓋了來自整個聯邦政府各機構的文件部分。
值得注意的限制
PNNL 和 OpenAI 坦率地說明了這個基準測試無法證明的內容。它評估的是在相關背景資料可用的情況下,明確指定的起草任務的表現——而非真實許可決策的混亂模糊性。
在審查失敗案例時,研究人員發現一些「錯誤」源於過時的引用和薄弱的評估標準,而非模型錯誤。實際部署將涉及專家反饋迴圈,預計會改善超越基準測試結果的表現。
如果來源材料不完整或不一致,模型不一定會在沒有明確指示的情況下標記問題。人工監督仍然至關重要。
更大的格局
這項合作夥伴關係屬於 PNNL 更廣泛的 PermitAI 計畫的一部分,由能源部政策辦公室資助。目標不是取代人工審查員——而是為政府工作人員提供 AI 團隊來處理耗時的文件工作,以便他們可以專注於判斷性決策和複雜決定。
OpenAI 表示,合作將繼續完善 PermitAI 應用程式。這些公司預計聯邦審查的基礎設施專案的平均批准時間最終將從數月降低到數週,儘管沒有提供實現這一降低的具體時間表。
對於 AI 產業而言,這代表了另一個政府驗證使用案例——展示了前沿模型可以處理真實的監管工作流程,而不僅僅是聊天機器人對話。這是否會轉化為更廣泛的聯邦 AI 採用,取決於後續試點在實際許可條件下的表現。
圖片來源:Shutterstock- openai
- 人工智慧
- 聯邦許可
- nepa
- 政府技術

