OpenAI开源GPT模型登陆SageMaker JumpStart平台
某中心宣布其SageMaker JumpStart平台现已支持OpenAI最新开源的GPT OSS模型(gpt-oss-120b和gpt-oss-20b)。这两款模型专长于编程、科学分析和数学推理任务,具有128K上下文窗口和可调节推理级别(低/中/高),支持外部工具集成和代理工作流。
技术特性
- 模型架构:基于Transformer的生成式预训练模型
-
- 核心能力:
-
- 完整思维链输出展示
-
- 支持通过Strands Agents等框架构建代理工作流
-
- 兼容OpenAI SDK直接调用
-
- 部署规格:
-
- 默认实例类型:p5.48xlarge
-
- 支持区域:美国东部(俄亥俄、弗吉尼亚北部)和亚太(孟买、东京)
部署指南
通过SageMaker控制台
- 登录SageMaker Studio控制台
-
- 在JumpStart页面搜索"gpt-oss-120b"
-
- 查看模型卡片并配置端点参数
-
- 选择GPU实例类型(推荐p5.48xlarge)
-
- 启动部署
使用Python SDK
from sagemaker.jumpstart.model import JumpStartModel
model = JumpStartModel(model_id="openai-reasoning-gpt-oss-120b")
predictor = model.deploy(accept_eula=True)
推理调用示例
payload = {"input": [{"role": "user","content": "解释量子计算基础"}],"max_output_tokens": 200
}
response = predictor.predict(payload)
网络搜索功能
通过集成EXA搜索API实现网络信息检索:
model = JumpStartModel(model_id="openai-reasoning-gpt-oss-120b",enable_network_isolation=False,env={"EXA_API_KEY": "<API_KEY>"}
)
函数调用示例
展示天气查询工具的调用格式:
{"tools": [{"type": "function","name": "get_current_weather","parameters": {"location": {"type": "string"}}}]
}
资源清理
完成测试后需删除端点避免额外计费:
predictor.delete_model()
predictor.delete_endpoint()
该解决方案为企业用户提供了安全可控的生成式AI部署环境,支持在私有VPC内运行模型,满足企业级数据安全需求。 更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)