OpenAI开源GPT模型登陆SageMaker JumpStart平台

某中心宣布其SageMaker JumpStart平台现已支持OpenAI最新开源的GPT OSS模型(gpt-oss-120b和gpt-oss-20b)。这两款模型专长于编程、科学分析和数学推理任务,具有128K上下文窗口和可调节推理级别(低/中/高),支持外部工具集成和代理工作流。

技术特性

  • 模型架构:基于Transformer的生成式预训练模型
    • 核心能力
    • 完整思维链输出展示
    • 支持通过Strands Agents等框架构建代理工作流
    • 兼容OpenAI SDK直接调用
    • 部署规格
    • 默认实例类型:p5.48xlarge
    • 支持区域:美国东部(俄亥俄、弗吉尼亚北部)和亚太(孟买、东京)

部署指南

通过SageMaker控制台

  1. 登录SageMaker Studio控制台
    1. 在JumpStart页面搜索"gpt-oss-120b"
    1. 查看模型卡片并配置端点参数
    1. 选择GPU实例类型(推荐p5.48xlarge)
    1. 启动部署

使用Python SDK

from sagemaker.jumpstart.model import JumpStartModel 
model = JumpStartModel(model_id="openai-reasoning-gpt-oss-120b")
predictor = model.deploy(accept_eula=True)

推理调用示例

payload = {"input": [{"role": "user","content": "解释量子计算基础"}],"max_output_tokens": 200
}
response = predictor.predict(payload)

网络搜索功能

通过集成EXA搜索API实现网络信息检索:

model = JumpStartModel(model_id="openai-reasoning-gpt-oss-120b",enable_network_isolation=False,env={"EXA_API_KEY": "<API_KEY>"}
)

函数调用示例

展示天气查询工具的调用格式:

{"tools": [{"type": "function","name": "get_current_weather","parameters": {"location": {"type": "string"}}}]
}

资源清理

完成测试后需删除端点避免额外计费:

predictor.delete_model()
predictor.delete_endpoint()

该解决方案为企业用户提供了安全可控的生成式AI部署环境,支持在私有VPC内运行模型,满足企业级数据安全需求。 更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)