这是本节的多页打印视图。点击此处打印.

模型适配器

AISE的模型能力层具备模型训练，微调以及对模型资产进行版本管理和变更管理的能力，确保可以为企业的大模型战略提供完整支撑

1: Qwen2.5模型适配

1. 基本模型能力

当前市场上的各类大模型层出不穷，企业的大模型战略需要适应市场的快速变化，确保引入到企业的模型可以灵活的适配各种场景，并且可以满足企业内部复杂组织架构、权限、安全性、审计等要求。同时，企业还需要根据内部的个性化需求对模型本身进行适配和调整，因此需要平台具备模型训练，微调以及对模型资产进行版本管理和变更管理的能力。

AISE的模型能力层提供以下能力，确保可以为企业的大模型战略提供完整支撑

多厂商适配：内置对市场主流大模型厂商的介入支撑，包括：微软Azure OpenAI， DeepSeek深度求索，Llama，HuggineFace，阿里通义大模型，华为和百川智能。
SaaS服务和私有部署支持：支持通过SaaS API和私有部署方式介入以上厂商的大模型服务。
推理服务通用接口支持：支持通过VLLM，TGI和OpenAI标准接口提供的推理服务。
英伟达Nvidia GPU支持：用户可以选择Nvidia A100，A800，A10，L20以及4090系列GPU作为私有部署的硬件算力。
国产华为晟腾系列NPU：用户可以选择晟腾系列NPU作为私有部署硬件算力，包括：晟腾910A/B系列，晟腾310系列；并支持多卡并行推理配置。
参数可视化配置：支持对模型常用参数进行可视化配置，用户管理员可以通过模型适配器界面完成模型参数的配置，内置标准化参数支持和个性化参数注入。
多实例负载均衡：用户可以为同一个模型实例添加多个子实例，AISE模型适配器自动针对多个子实例提供流量分配，为用户提供模型实例的横向扩展能力。
模型路由能力：支持按模型类型、按组织单位、按应用场景进行模型路由分配。
组织架构路由：支持针对不同部门提供不同的模型实例，支持在统一场景下为不同组织单位提供不同的模型路由，比如：同样是代码补全服务，可以为不同开发小组分配不同的代码补全模型。
按场景进行模型路由：针对代码补全、代码对话、通用代码任务，如：代码解释、代码纠错，代码评审、单元测试生成等不同任务提供不同的模型路由。
增强型模型密钥验证能力：在使用Azure OpenAI的模型服务时，支持通过Service Principle的方式进行服务端身份验证，并动态获取模型密钥（access token），此密钥在一定时间内自动过期，提供更高的安全性和企业可管理性。
支持在固定代码任务中使用FIM模式：FIM（Fill in the Middle）是一种特殊的生成模式，通过对前文和后文的同时推理提供更优化的模型生成控制，一般用户代码生成任务。AISE不仅代码生成任务上提供FIM能力，同时也支持在通用代码任务（代码解释、代码纠错，代码评审、单元测试）上使用FIM能力。

模型支持列表

AISE模型适配器内置对以下厂商和模型提供开箱即用的接入能力。

#	提供商	商用 / 开源	接入方式	模型名称	备注
1	微软	商用	SaaS API	GPT 3.5 Turbo
				GPT 3.5 Turbo 16K
				GPT 3.5 Turbo Instruct
				GPT 4.0
				GPT 4.0 32K
				GPT 4.0 128K
				GPT 4o	多模态支持
				GPT 4o mini	多模态支持
				text-davinci-003
				text-embedding-ada-002
				text-embedding-3
2	深度求索	商用	SaaS API	DeepSeek Coder
				DeepSeek Chat
				DeepSeek v2 Coder
				DeepSeek v2
3	深度求索	开源	私有部署	DeepSeek Coder 6.7 Base	晟腾/英伟达
				DeepSeek Chat 6.7 Instruct	晟腾/英伟达
				DeepSeek Coder 33B Base	晟腾/英伟达
				DeepSeek Chat 33B Instruct	晟腾/英伟达
4	阿里巴巴	开源	私有部署	Qwen1.5 72B	晟腾/英伟达
				Qwen1.5 72B	晟腾/英伟达
5	微软	开源	私有部署	WizardCoder15B	英伟达
6	Jinna	开源	私有部署	jina-embeddings-v2-base-zh
				jina-embeddings-v2-base-code

2. 模型全局配置

模型配置完成后，需要对AISE进行模型全局配置，来配置智能对话中可以使用的模型，代码补全中可以使用的模型，向量化模型等等。

点击系统管理｜参数设置｜找到参数名称为“全局配置-模型” 的参数

修改配置，配置如下：

详细介绍：

  "chat_model_types":[
      "completion_azure_gpt",
      "completion_azure_gpt35_16k",
      "completion_azure_gpt4",
      "completion_azure_gpt4_32k",
      "completion_azure_gpt4_128k",
      "completion_deepseek_chat"
    ],
  "embedding_model_type":   "embedding_azure_text-embedding-ada-002",
  "code_completion_model_types": [
      "codecompletion_azure_text-davinci-003"
    ],
  "task_configuration":{
      "chat_model":{
          "use_current_chat_model":"false",
          "task_method_chat_model_type":"completion_azure_gpt35_16k"
        },
      "completion_model":{
        "task_method_completion_model_type":"completion_azure_text-davinci-003"
        }
    }
}

参数说明

参数	说明
chat_model_types	代码对话可以使用的模型列表
embedding_model_type	指定向量化模型
code_completion_model_types	指定代码补全模型
task_method_chat_model_type	指定提示词模版为对话类型时使用的模型
task_method_completion_model_type	指定提示词模版为完成类型时使用的模型

3. 添加模型

将企业内选型的模型通过模型适配器，添加到AISE中，并在具体的AI应用场景中使用这些模型。添加方式如下：

点击AISE管理｜模型适配器

输入模型标识｜模型类型｜模型参数｜配置项添加模型

参数
模型类型	下拉列表选择
模型参数	{“temperature”:“0.7”,“max_tokens”:“800”,“top_p”:“0.95”,“frequency_penalty”:“0”,“presence_penalty”:“0”,“stop”:"",“chunk_size”:""}
配置项	{“API_KEY”: “”,“ServiceEndPoint”: “”,“ApiVersion”: “2023-03-15-preview”,“deploymentName”: “”}

4. 启用多实例

通过启用多实例的方式来对流量进行不同模型实例的分发，适用于用户量比较大的企业

启用 “是否有实例”
点击添加配置项
输入其他实例配置项信息

5. 模型权限配置

对模型进行访问权限控制，支持公开模型，以及按部门划分模型访问权限。

访问权限控制

部门权限

1 - Qwen2.5模型适配

Qwen2.5模型适配

特性说明

orch服务增加对Qwen2.5模型的适配，适配后，通过配置，可用Qwen2.5模型进行chat对话，代码补全,提示词。

操作指引

新增模型类型用途说明

completion_qwen_chat
用途：适用于提供对话能力的模型适用模型:qwen2.5-14b、qwen2.5-72b-instruct、Qwen2.5_Coder_32B_Instruct
codecompletion_qwen_coder
用途：适用于提供代码补全能力的模型适用模型:qwen2.5-14b、qwen2.5-72b-instruct、Qwen2.5_Coder_32B_Instruct
completion_qwen_completion
用途：适用于对完成模式提示词进行解释的模型适用模型:qwen2.5-14b、qwen2.5-72b-instruct、Qwen2.5_Coder_32B_Instruct

配置模型适配器

新增模型适配器时的参数说明：

1.1 模型适配器参数说明

参数名称	示例数据	取值范围	说明
模型标识	Qwen2.5_72B_Chat_Saas	任意字符串	模型唯一标识
模型名称	Qwen2.5 72B Saas	任意字符串	模型对外展示的名称
模型关键字	Chat	Chat/Completion	标记模型是对话能力还是补全能力
模型版本	2.5	任意字符串	部署模型的版本
模型类型	completion_qwen_chat	模型类型列表数据	参照新增模型类型用途说明
状态	有效	有效/无效	模型是否可用
访问范围	公开	公开/部门	模型设置访问权限
模型参数	{“repetition_penalty”:1, “temperature”:0.2, “max_tokens”:800, “top_p”:0.95, “token_limit”:8192, “token_limit_safebuffer”:200}	JSON格式	详见 1.2 模型参数说明，模型的默认参数配置。
配置项	{ “API_KEY”: “sk-123456”, “ServiceEndPoint”: “”, “ApiVersion”: “”, “deploymentName”:“qwen2.5-14b”}	JSON格式	详见 1.3 配置项参数说明，模型的基本信息配置

1.2 模型参数说明

参数名称	默认取值	取值范围	说明
temperature	0.2	[0, 2)	用于控制模型回复的随机性和多样性。
max_tokens	800	小于模型输出最大长度	指定模型可生成的最大token个数。
presence_penalty	0	[-2.0, 2.0]	用于控制模型生成时整个序列中的重复度。
top_p	0.95	(0,1.0)	生成过程中的核采样方法概率阈值。
token_limit	10240	与模型相关	配置最大token数，一般与模型相关。
token_limit_safebuffer	200	200	token最大安全缓冲区。
stop	-	-	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。

1.3 配置项参数说明

参数名称	示例数据	说明
API_KEY	sk-123456	apikey，用于访问接口的权限验证。
ServiceEndPoint	https://ip:port/compatible-mode/v1/chat/completions	模型请求地址
API_TYPE	TGI	N卡环境默认为VLLM，昇腾为TGI，不配置默认为VLLM。
ApiVersion	-	VLLM
deploymentName	qwen2.5-14b	模型名称

新增对话模型。
需要在模型适配器中增加Qwen2.5_14B_Chat(N卡环境)/Qwen2.5_32B_Chat_TGI（昇腾环境）/Qwen2.5_72B_Chat_Saas（SaaS版）模型，并确保模型类型指定为：completion_qwen_chat
新增代码补全模型。
需要在模型适配器中增加Qwen2.5_14B_Coder（N卡）/Qwen2.5_32B_Coder_TGI（昇腾）模型，并确保模型类型指定为：codecompletion_qwen_coder
新增提示词推理模型。
需要在模型适配器中增加Qwen2.5_14B_Completion（N卡）/Qwen2.5_32B_Completion_TGI（昇腾）模型，并确保模型类型指定为：completion_qwen_completion

配置全局配置-模型

配置全局配置-模型
点击系统管理/参数设置菜单，找到全局配置-模型
chat对话配置Qwen2.5
点击修改，在 “chat_model_types”:配置内容增加"completion_qwen_chat" 。此时在对话时的对话模型选择时就可以选择Qwen2.5模型进行对话。
代码补全配置Qwen2.5
点击修改， “code_completion_model_types”:配置内容修改为"codecompletion_qwen_coder" 。此时使用SmartCode插件进行代码补全时，就会使用Qwen2.5来完成。
提示词配置Qwen2.5
1. 点击修改， “task_method_completion_model_type”:配置内容修改为"completion_qwen_completion" 。此时使用完成模式的提示词时，就会使用Qwen2.5 模型来完成。
2. 点击修改， “task_method_completion_model_type”:配置内容修改为"completion_qwen_completion" 。此时使用完成模式的提示词时，就会使用Qwen2.5模型来完成。

模型适配器

1. 基本模型能力

AISE的模型能力层提供以下能力，确保可以为企业的大模型战略提供完整支撑

模型支持列表

2. 模型全局配置

3. 添加模型

4. 启用多实例

5. 模型权限配置

1 - Qwen2.5模型适配

特性说明

操作指引

新增模型类型 用途说明

completion_qwen_chat

codecompletion_qwen_coder

completion_qwen_completion

配置模型适配器

新增模型适配器时的参数说明：

1.1 模型适配器参数说明

1.2 模型参数说明

1.3 配置项参数说明

新增对话模型。

新增代码补全模型。

新增提示词推理模型。

配置 全局配置-模型

配置全局配置-模型

chat对话配置Qwen2.5

代码补全配置Qwen2.5

提示词配置Qwen2.5

新增模型类型用途说明

配置全局配置-模型