AI 网关快速集成

AI 网关快速集成

AI 网关快速集成

为 Agent 开发、LLM API 管理,提供易用、可靠的集成服务。

已支持 100 多种大语言模型和版本,提供开源和云上商业化版本。

为 Agent 开发、LLM API 管理,提供易用、可靠的集成服务。

已支持 100 多种大语言模型和版本,提供开源和云上商业化版本。

AI 网关

AI 网关

为开发者提供了一站式的 AI 插件集和增强后端模型调度处理能力,使得 AI 与网关的集成更加便捷和高效。

为开发者提供了一站式的 AI 插件集和增强后端模型调度处理能力,使得 AI 与网关的集成更加便捷和高效。

多模型代理

AI 网关能够将外部调用不同大模型的请求,通过统一的调用方式转发到内部对应的大模型上,使得后端模型调度更加灵活;Higress AI 网关支持常用的100多个模型的统一协议转换,并支持模型级 Fallback 。

多模型代理

AI 网关能够将外部调用不同大模型的请求,通过统一的调用方式转发到内部对应的大模型上,使得后端模型调度更加灵活;Higress AI 网关支持常用的100多个模型的统一协议转换,并支持模型级 Fallback 。

多模型代理

Higress AI 网关支持常用的100多个模型的统一协议转换,能够将外部调用不同大模型的请求,通过统一的调用方式转发到内部对应的大模型上。

多模型代理

Higress AI 网关支持常用的100多个模型的统一协议转换,能够将外部调用不同大模型的请求,通过统一的调用方式转发到内部对应的大模型上。

内容安全

AI 网关能够保护和大模型交互时的数据安全,一方面对于输入到外部模型的数据进行隐私保护,另一方面对于输出给用户的数据进行内容过滤。

内容安全

AI 网关能够保护和大模型交互时的数据安全,一方面对于输入到外部模型的数据进行隐私保护,另一方面对于输出给用户的数据进行内容过滤。

内容安全

AI 网关能够保护和大模型交互时的数据安全,一方面对于输入到外部模型的数据进行隐私保护,另一方面对于输出给用户的数据进行内容过滤。

内容安全

AI 网关能够保护和大模型交互时的数据安全,一方面对于输入到外部模型的数据进行隐私保护,另一方面对于输出给用户的数据进行内容过滤。

语义缓存

AI 网关支持精确缓存及语义缓存推理的结果上下文,对于常见的相似或重复的问题节省 Token 并减小时延,从而提升调用体验。

语义缓存

AI 网关支持精确缓存及语义缓存推理的结果上下文,对于常见的相似或重复的问题节省 Token 并减小时延,从而提升调用体验。

语义缓存

AI 网关支持精确缓存及语义缓存推理的结果上下文,对于常见的相似或重复的问题节省 Token 并减小时延,从而提升调用体验。

语义缓存

AI 网关支持精确缓存及语义缓存推理的结果上下文,对于常见的相似或重复的问题节省 Token 并减小时延,从而提升调用体验。

令牌限流

AI 网关能够对大模型使用的 Token 数量进行追踪,在消费者使用超额时进行限制,从而更好管理调用 AI 服务中的用户额度,为 Token 使用分析提供数据支持。

令牌限流

AI 网关能够对大模型使用的 Token 数量进行追踪,在消费者使用超额时进行限制,从而更好管理调用 AI 服务中的用户额度,为 Token 使用分析提供数据支持。

令牌限流

AI 网关能够对大模型使用的 Token 数量进行追踪,在消费者使用超额时进行限制,并为 Token 使用分析提供数据支持。

令牌限流

AI 网关能够对大模型使用的 Token 数量进行追踪,在消费者使用超额时进行限制,从而更好管理调用 AI 服务中的用户额度,为 Token 使用分析提供数据支持。

AI 应用场景下的最佳实践服务于多领域企业级用户

AI 应用场景下

企业级最佳实践

国泰所有访问大模型的流量均通过阿里云云原生 API 网关进行代理,在日均消耗近亿 Token 的同时,做到了对每个请求都进行敏感信息过滤,不论是输入大模型的内容还是由大模型产生的内容都进行了全面审计,大大降低使用大模型的数据安全风险。

国泰产险

智保未来:国泰产险的 AI 网关革新之旅

国泰所有访问大模型的流量均通过阿里云云原生 API 网关进行代理,在日均消耗近亿 Token 的同时,做到了对每个请求都进行敏感信息过滤,不论是输入大模型的内容还是由大模型产生的内容都进行了全面审计,大大降低使用大模型的数据安全风险。

国泰产险

智保未来:国泰产险的 AI 网关革新之旅

国泰所有访问大模型的流量均通过阿里云云原生 API 网关进行代理,在日均消耗近亿 Token 的同时,做到了对每个请求都进行敏感信息过滤,不论是输入大模型的内容还是由大模型产生的内容都进行了全面审计,大大降低使用大模型的数据安全风险。

国泰产险

智保未来:国泰产险的 AI 网关革新之旅

在 API 对外进行暴露的时候,零一万物遇到了所有 AI 厂商都会遇到的长连接、高延时、大带宽、限流稳定性,以及 Token 计量计费的问题。通过云原生 API 网关的插件热更新能力、细颗粒度的集群限流能力、流式处理能力、丰富的可观测能力,解决了这些问题。

零一万物

在入口建立安全&高可用防线&Serverless

在 API 对外进行暴露的时候,零一万物遇到了所有 AI 厂商都会遇到的长连接、高延时、大带宽、限流稳定性,以及 Token 计量计费的问题。通过云原生 API 网关的插件热更新能力、细颗粒度的集群限流能力、流式处理能力、丰富的可观测能力,解决了这些问题。

零一万物

在入口建立安全&高可用防线&Serverless

在 API 对外进行暴露的时候,零一万物遇到了所有 AI 厂商都会遇到的长连接、高延时、大带宽、限流稳定性,以及 Token 计量计费的问题。通过云原生 API 网关的插件热更新能力、细颗粒度的集群限流能力、流式处理能力、丰富的可观测能力,解决了这些问题。

零一万物

在入口建立安全&高可用防线&Serverless

Ingress-Nginx 对 GRPC 长连接服务访问支持的并不好,切换到 Higress 网关不仅能够解决了客户的模型推理服务为长连接会话访问的场景还解决了网关配置更新及扩缩容带来的链接断开的稳定性问题。

贝联珠贯

使用 Higress 网关解决AI推理服务长链接访问问题的落地实践

Ingress-Nginx 对 GRPC 长连接服务访问支持的并不好,切换到 Higress 网关不仅能够解决了客户的模型推理服务为长连接会话访问的场景还解决了网关配置更新及扩缩容带来的链接断开的稳定性问题。

贝联珠贯

使用 Higress 网关解决AI推理服务长链接访问问题的落地实践

Ingress-Nginx 对 GRPC 长连接服务访问支持的并不好,切换到 Higress 网关不仅能够解决了客户的模型推理服务为长连接会话访问的场景还解决了网关配置更新及扩缩容带来的链接断开的稳定性问题。

贝联珠贯

使用 Higress 网关解决AI推理服务长链接访问问题的落地实践

higress在开源的wasm client上做了封装,更方便开发者做插件的开发,比如做了插件生效的范围控制,并且社区已有很多插件能力可以直接使用。higress在多数据源这块集成了多种主流注册中心,这些能力可以直接复用,不用重复建设。

政采云

政采云业务网关实践

higress在开源的wasm client上做了封装,更方便开发者做插件的开发,比如做了插件生效的范围控制,并且社区已有很多插件能力可以直接使用。higress在多数据源这块集成了多种主流注册中心,这些能力可以直接复用,不用重复建设。

政采云

政采云业务网关实践

higress在开源的wasm client上做了封装,更方便开发者做插件的开发,比如做了插件生效的范围控制,并且社区已有很多插件能力可以直接使用。higress在多数据源这块集成了多种主流注册中心,这些能力可以直接复用,不用重复建设。

政采云

政采云业务网关实践

联系我们

通过以下方式,加入并关注我们,获取 higress.ai 最新动态;如您在使用过程遇到问题,请联系我们。

钉钉群

微信群

Higress 公众号

联系我们

通过以下方式,加入并关注我们,获取 higress.ai 最新动态;如您在使用过程遇到问题,请联系我们。

钉钉群

微信群

Higress 公众号

联系我们

通过以下方式,加入并关注我们,获取 higress.ai 最新动态;如您在使用过程遇到问题,请联系我们。

钉钉群

微信群

如过期请加微信:nomadao,注明 higress

Higress 公众号

联系我们

通过以下方式,加入并关注我们,获取 higress.ai 最新动态;如您在使用过程遇到问题,请联系我们。

钉钉群

微信群

如过期请加微信:nomadao,注明 higress

Higress 公众号