📊 技術學習
AWS
Amazon Bedrock AgentCore Browser Tool
日期: 2026-02-06
來源: https://aws.amazon.com/tw/blogs/machine-learning/introducing-amazon-bedrock-agentcore-browser-tool/
概述: AWS 推出的完全託管雲端瀏覽器工具,讓生成式 AI 代理可以無縫地與網站互動。
核心問題解決:
- Foundation Models 的限制: 訓練資料靜態,需要動態存取即時資訊
- 企業規模化挑戰: AI 網頁自動化的擴展性問題
核心功能:
- 🌐 完整網頁互動(導航、點擊、填表單)
- 🖼️ 視覺理解(截圖、元素識別)
- 🔒 企業級安全(會話隔離、IAM 控制)
- 📈 無限擴展(單一到數千會話)
- 🤖 整合框架(Playwright、Amazon Nova Act、Browser Use)
主要使用案例:
- 自動化重複性網頁任務
- AI 驅動的研究與情報蒐集
- 跨系統複雜工作流程自動化
- 測試與品質保證
- 舊系統整合(沒有 API 的系統)
技術整合:
- 瀏覽器自動化程式庫:Playwright, Puppeteer, Selenium
- AI 代理框架:Amazon Nova Act, Browser Use
- 多代理工作流程整合
工作流程:
- 使用者發送查詢
- 代理框架將查詢傳遞給 LLM
- LLM 生成結構化指令(JSON)
- 框架對應到瀏覽器操作指令
- 透過 WebSocket 在 AgentCore Browser 執行
- 回應和截圖傳送給代理推理
- 重複直到完成
定價:
- 基於消費的定價,無前期承諾
- 2025/09/16 前免費試用
- 按每秒計費(CPU + 記憶體使用量)
- 最低 128 MB 記憶體計費
資源連結:
應用場景思考:
- 旅遊業價格監控與資料收集
- 自動化測試與品質保證
- 客戶服務自動化
- 舊系統現代化整合
AI Agent
OpenClaw 技術架構深度解析
日期: 2026-02-06
來源: https://accucrazy.com/openclaw-taiwan
核心理念: 把 AI Agent 當成「會做事的同事」,OpenClaw 不是教它說話,而是為它建立一個「運作良好的辦公室」。
架構設計(機場比喻):
- 🗼 Gateway(塔台): 控制平面,負責調度與安檢
- 📞 Channels(櫃台): Telegram、LINE、Slack 等通道
- ✈️ Sessions(航班): 獨立的對話脈絡
- 👨✈️ Assistant/Workspace(飛行員): 真正做事的核心
- 🔒 Sandbox(隔離艙): 風險任務的隔離執行
核心元件詳解:
-
Gateway - 控制平面
- 長駐服務(Long-running Service)
- 整合通道管理、Session 路由、WebSocket 控制
- 優點:通道可替換、無痛開發驗證、統一政策
-
Pairing - 安全邊界
- 陌生人需要配對才能對話
- 身分綁定機制
- 安全文件
-
Sandboxing - 風險隔離
- 三種模式:off / non-main(建議)/ all
- 群組權限低於私聊
- 用政策管理風險
-
Memory - 筆記 + 索引
- Markdown 檔案(人類可讀)
- SQLite-vec(輕量索引)
- 優點:低成本、可控、可維運
部署建議:
- ✅ VM 部署優於 Serverless
- 原因:WebSocket 長連接、狀態持久化、回應體感
安全原則:
- Skills = 安裝程式(確認來源)
- 群組必加沙盒
- 鎖好控制平面
OpenClaw-Taiwan 專案:
- 通道在地化(優化 LINE)
- 情境模板(會議紀錄、小編、客服)
- 安全預設配置
資源連結:
關鍵學習:
- 工程思維優先(安全、隔離、權限內建)
- 記憶系統:Markdown + 輕量索引平衡可讀性與效能
- Pairing 機制:把「誰可以對話」做成產品流程
- VM vs Serverless:長期運作選 VM 更穩定
前端
(待補充)
後端
(待補充)