280│2024年│3期2024年第46卷第3期基于多租户架构的企业GPT构造器的设计及其在5G消息上的应用李红纲丁健作者简介:李红纲(1977-),硕士,高级工程师,研究方向为云计算、大语言模型、消息服务、OSS/BSS;丁健(1982-),本科,中级工程师,研究方向为云计算、智能计算、大模型运营。(浩鲸云计算科技股份有限公司南京210012)摘要ChatGPT以其强大的自然语言处理和知识推理技术,在全球范围内引起了大型语言模型(LLM)的热潮。通过基于多租户基础架构的企业GPT构造器,实现了企业网站抓取和文档加载功能,为中小型企业租户提供了私域数据喂养和向量化服务,并将语料向量作为LLM的长期记忆,构建了企业级GPT能力。通过配置的5G消息Chatbot同企业客户进行交互,在交互过程中,其能通过检索向量数据库中的企业相关信息,提供企业级的ChatGPT服务。关键词:大语言模型;向量数据库;ChatGPT;企业GPT;多租户;5G消息;聊天机器人中图分类号TP311.5DesignofMulti-tenantBasedEnterpriseGPTBuilderandApplicationfor5GMessageLIHonggangandDINGJian(WhaleCloudTechnologyLtd,Nanjing210012,China)AbstractWithitspowerfulnaturallanguageprocessingandknowledgereasoningcapability,ChatGPThascausedthecrazeoflargelanguagemodels(LLM)aroundtheworld.ThroughtheenterpriseGPTbuilderbasedonmulti-tenantinfra-structure,itrealizesthefunctionsofenterprisewebsitecrawlinganddocumentloading,providesprivatedomaindatafee-dingandembeddingserviceforsmallandmedium-sizedenterprisetenants,andusesembeddedvectorsasthelong-termmemoryofLLMtobuildenterprise-levelGPTcapabilities.Throughtheconfigured5GmessageChatbottointeractwithenterprisecustomers,itcanprovideenterprise-levelChatGPTservicesbyretrievingenterprise-relatedinformationinthevectordatabase.KeywordsLargeLanguageModel,Vectordatabase,ChatGPT,EnterpriseGPT,Multi-tenant,5Gmessage,Chatbot0引言大语言模型(LLM)指使用大量文本数据训练的深度学习模型,其可以生成自然语言文本或理解语言文本的含义。大语言模型具有令人印象深刻的自然语言理解和生成能力,具备生成各种格式和风格的文字回答等能力[1]。2022年11月底,OpenAI发布了ChatGPT,使其一跃成为AI领域的现象级应用。国内百度、阿里等互联网头部企业和清华大学等科研机构竞相布局AI产业,并推出了“文心一言”“通义千问”“智谱清言”等大语言模...