某中心发布AgentCore云端浏览器工具

在某机构2025纽约峰会上,某机构云服务(AWS)宣布推出Amazon Bedrock AgentCore浏览器工具的预览版。该工具作为完全托管的云端浏览器,使生成式AI代理能够无缝与网站交互,解决两大核心问题:基础模型依赖静态训练数据而缺乏实时信息获取能力;企业在规模化部署AI网页自动化时面临的技术挑战。

技术背景与价值

AgentCore浏览器工具专为多步骤复杂任务设计,提供以下关键能力:

  • 动态数据获取:突破API限制,直接从网页获取实时数据
    • 规模化部署:支持数千并发会话的企业级自动化需求
    • 基础设施托管:消除自建浏览器集群的管理负担 典型应用场景包括:
  1. 重复性任务自动化:表单填写、数据提取、内容预审
    1. 智能研究助手:价格监控、舆情分析、知识库更新
    1. 跨系统工作流:多SaaS系统集成、供应链可视化
    1. 测试验证:跨设备兼容性测试、持续性监控
    1. 遗留系统对接:无API旧系统的数据提取

核心技术特性

网页交互能力

  • 完整导航控制(含多页流程)
    • JavaScript富应用支持
    • 表单操作(文本/下拉/文件上传)
    • 拟人化交互(滚动/悬停/点击)

无服务器架构

  • 自动扩缩容(单会话至数千并发)
    • 全球部署选项
    • 按用量计费模式

视觉理解

  • 全页面截图分析
    • 视觉元素定位
    • 图形内容提取
    • 分辨率/设备模拟

企业级安全

  • 会话隔离机制
    • IAM访问控制
    • 临时会话销毁

开发支持

# Playwright集成示例
from bedrock_agentcore.tools.browser_client import browser_sessionwith browser_session('us-west-2') as client:ws_url, headers = client.generate_ws_headers()# 建立浏览器连接...page.goto("https://example.com")

技术实现路径

AI代理通过以下流程驱动浏览器:

  1. 用户输入自然语言指令(如"搜索某商品")
    1. 代理框架(如Nova Act)将指令转换为结构化命令
    1. 通过WebSocket安全连接执行浏览器操作
    1. 返回页面响应及截图供AI进一步分析

部署要求

  • Python 3.10+环境
    • IAM权限配置
    • 可选可视化组件BrowserViewerServer
# 快速启动命令
git clone https://github.com/awslabs/amazon-bedrock-agentcore-samples.git
pip install bedrock-agentcore

计费模式

  • 按秒计费(CPU/内存峰值计量)
    • 预览期免费(截至2025年9月16日)
    • 128MB内存起计 该工具现已开放使用,技术文档详见某机构云服务官方开发者指南。 更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)