品书中文 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!
品书中文 >  离语 >   第277章 延迟

向量知识库构建是一个将处理过的数据嵌入向量知识库的过程,主要用于将不同类型的数据转

化为向量,并进行存储和检索。其流程如图 4.1 所示。

图 4.1 向量知识库构建流程

对收集到的数据进行清洗、去重、分类,提取分割文本,以确保数据的质量和有效性。消除噪

声数据,提高数据的一致性和准确性。将预处理后的数据转化为向量,将向量化后的数据存储到向

量知识库中,并利用向量数据库进行高效的存储和检索。向量数据库是一种专门用于存储和检索向

量数据的数据库系统,可以根据语义或上下文含义查找最相似或相关的数据。

测试流程包括以下几个步骤:

测试设计:根据目标领域定义测试用例,包括典型问题、边缘情况和错误输入。

环境搭建:搭建测试环境,包括聊天界面和后端模型处理系统。

执行测试:记录模型的回应。

评估结果:根据预设的标准(如准确性、响应时间、用户满意度)评估模型表现。

优化模型:根据测试结果对模型进行调整和优化。

5.2 智能交互组件 chatbot

chatbot 是一种人工智能程序,它设计用于模拟人类对话,并且能够基于事先编程或机器学习

技术来进行智能对话交流。chatbot 通常被用于客户服务、信息查询、娱乐等各种场景,可以通过

文本或语音与用户进行交互。

chatbot 的一些特点和作用包括:

1自动化交互:chatbot 可以自动回答用户提出的问题,执行指定的任务,无需人工干,减少

人力成本和时间消耗。

2实时响应:chatbot 能够在任何时间、任何地点提供服务,随时响应用户的问题和需求。

3个性化服务:chatbot 可以根据用户的需求和历史数据提供个性化的服务和建议,提高用户

体验。

4多渠道支持:chatbot 可以在多种通信渠道上运行,如网页、应用程序、社交媒体平台等,

为用户提供多样化的对话途径。

本项目选择 openAI 的 Gpt 模型作为 chatbot 的大语言模型基座,Gpt 模型基于 transformer

架构,相较于其他模型,这种架构允许模型在处理长文本时保持较好的性能,同时具有良好的并行

化能力,使得模型的训练和推理速度得到提升。

5.2.1 chatbot 后端

基于先前构建的针对电力 LcA 领域的向量知识库构建 chatbot 测试模型性能,主要设计思路是

为了实现检索功能,大致可分为知识库检索功能和在线搜索。

chatbot 功能流程图如图 5.1 所示。

用户通过 chatbot 界面输入他们的问题或请求。对用户输入文本进行清洗,包括去除标点符

号,进行分词等。转化为结构化数据后将预处理后的文本转换为向量形式,以便于机器理解。将向

量化处理后的用户问题构建成搜索向量。使用搜索向量与知识库中已向量化的内容进行匹配,找出

相关的信息。对匹配到的知识库内容进行排序,选择最相关的几个回答候选。为保证性能设置最相

关的问答数量。基于排序和选择的结果,生成回答,将最终确定的回答返回给用户。

对于用户输入的问题语句进行文本预处理,随后将其变成机构化数据后向量化,与先前处理文

献数据类似,因此这里不再赘述。

知识库搜索:

以下是通过 weaviate 在名为“water”的集合中搜索与特定查询文本相近的文档,并返回相

关文档的内容和来源,设置 top_k=3,考虑计算机性能与运行速度,只寻找三个匹配项。

这段代码最终返回一个包含匹配文档内容和来源的列表。

在线搜索:

以下是通过在线搜索引擎在互联网上搜索相关内容,并返回格式化的文档列表,其中包含每个

搜索结果的摘要内容和来源链接的代码,同样设置 top_k=3,返回三个匹配项。

通过 duckduckGo 搜索引擎在互联网上搜索相关内容,并返回格式化的文档列表,其中包含每

个搜索结果的摘要内容和来源链接。代码利用正则表达式提取搜索结果中的摘要、标题和链接信

息,并对结果进行整理和格式化,以便展示给用户。通过这个函数,用户可以通过输入查询来搜索

互联网上的相关信息,并查看摘要和链接。

Streamlit 是一个强大的 python 库,主要用于机器学习、数据可视化和 web 应用程序的快速

开发。用户在编写代码时可以实时看到应用界面的变化,快速调试和验证结果。内置多种交互式组

件(如滑块、复选框等)方便用户与应用进行互动。支持快速创建数据可视化图表,如折线图、散

点图、地图等,展现数据分析结果。

5.3 测试模型与优化

性能评估的目的是通过系统的测试结果来识别当前实现的短板和潜在改进点。基于这些评估,

可以针对性地对向量知识库进行优化,从而提高整体模型的准确性和效率。以下是如何根据

chatbot 模式测试的结果对向量知识库进行优化。

在性能评估过程中,需要关注几个关键指标:

1.准确率:模型响应的正确性。

2.响应时间:从接收到查询到返回响应的时间。

3.用户满意度:基于用户反馈的满意度评分。

4.系统稳定性:系统在连续运行时的稳定性和可靠性。

通过以上三种途径的问答,可以看到,通过向量知识库和在线搜索与大语言模型本身相结合,

即 RAG 技术,均为大语言模型优化了生成回答的准确性,对大语言模型的专业领域知识做了补充和

改善。

基于以上的性能评估结果,可以采取以下步骤对向量知识库进行优化。

1.增强向量覆盖范围:对于准确率低的查询,分析模型回应错误的原因。如果是由于知识库中

缺少相关信息,可以通过添加更多相关文档和数据来增强向量知识库的覆盖范围。

2.优化向量生成算法:重新训练向量生成模型,使用更大的数据集或更复杂的模型架构,以提

高向量的质量和表达能力。

3.调整检索算法:如果响应时间较长或返回的向量与查询关联度不高,考虑优化检索算法。例

如,采用更快的检索算法或调整向量匹配逻辑。

4.用户反馈集成:建立一个机制,允许用户在使用过程中提供反馈。这些反馈可以直接用于指

导向量知识库的更新和优化。

5.持续监控和测试:建立持续的性能监控和定期测试机制,确保向量知诀库的持续优化和模型

性能的稳定性。

5.4 本章小结

向量知识库后,对向量知识库的效果进行检验,也对本项目进项完善,设计了一个 chatbot 模

式来对向量知识库进行优化,通过向 chatbot 提问,看基于电力 LcA 领域的专业大模型能否回答专

业问题。通过 chatbot 实现了用户对文献的检索功能,最后是通过对模型回答问题的准确率,正确

率进行评估,从而实现将模型不断优化。

品书中文推荐阅读:玄幻:老婆绝世仙子,我却要逃婚绑定变美系统,绿茶在位面杀疯了诡异捞尸:开局暴打千年水鬼快穿:挖野菜系统崩溃了四合院:生那么多孩子!怪我咯穿越八零:上啃老下啃小中间啃闺灵轩心动快穿之疯批反派在线作死快穿:钓系美人穿成黑月光之后开局策反病娇女BOSS的我无敌原神获得造物主系统的诸天之旅异世界:种地摆烂,怎么成领主了傅同学,我知道你暗恋我结婚两年未见面,军医老公回来了恶魂觉醒后,全宗门哭着求我原谅太师祖在下,孽徒桀桀桀!穿越年代文:工具人拒绝剧情哼,老娘才不想当什么丘比特火行天下末世向导:四大哨兵争着宠霹出个天尊化神老祖作香童是认真的豪门奶爸开局,养个外挂小奶娃穿成小炮灰的姐姐,改变命运摸一摸就能修仙,还要脸干什么!快穿:洗白的郎君他最宠夫国运:扮演张麒麟,我是女版小哥真千金驻岛开荒,嫁禁欲军官赢麻神卦狂妃又在撩人了世界与尔青云仙梦张悦的逆袭没错,我哥和我爹都是大佬末日重生:鬼观音她畸变成神抗战:从远征军开始亮剑:之超级军工系统从模拟开始成为诡异神灵小孕妻齁甜,被绝嗣大佬抱回家宠快穿之云华真君圆满之旅快穿:我家宿主超厉害的,嗷呜盗墓:修仙修到青铜门碎裂掌控被未婚夫送去和亲后,我把他刀了快穿之改变be世界一夜情后,穆总失控刑侦六组全家读我心后杀麻了,我负责吐槽原神:从摸鱼开始出轨爹,爱赌妈,重生我笑呵呵一吻唤醒前世爱人爱错一人,毁了一生
品书中文搜藏榜:异兽迷城半相热恋快穿:我在异界客串路人甲家外火影世界的修士开局逃荒,女尊小混子她吃喝不愁和狂野总裁同房后他说我只是陌生人墓虎带着两宝去逃荒,我逃成了首富穿越乱世,我有空间我怕谁秦老六的生活日常奥特次元:羁绊之力全能站姐变爱豆后成顶流了高嫁京圈大佬,渣前任悔疯了!末世,女主她拿百亿物资杀疯了孤独摇滚!属于老兵的孤独!穿越知否之我是墨兰末世,恋爱脑杀了最后一位神性转魔王的异世界冒险脑叶公司:逐渐离谱的员工我,AI凡人闯仙界首辅肥妻有空间小宫女娇软妩媚,一路荣宠成太后后妈恶毒后妈爽,后妈日子过得好陆爷的闪婚新妻明日方舟:构史学主演她是一池春水文昭皇后传邪祟复苏,我为阴世主综漫:作品太刀,雪乃让我别写了玄学直播间,大佬又算命攒功德啦八零软妻人间清醒,首长别茶了!孤爱的哥哥居然是敌国皇亲快穿:战神大人只想找lp贴贴嫡女谋略:妖孽夫君请上门百字日记白日深诱职业魅魔,青梅校花不放过沈氏家族美人祭莫爷养的小公主我用重生埋葬他勾魂的眼神方舟里的后勤官快穿之鼠鼠我呀,太上进了四合院:我何雨柱,国之栋梁斗破:天命反派,云韵哭惨了皇后,你逃不掉的重生成草,我修妖也修仙我花钱超猛,系统嘎嘎宠我!
品书中文最新小说:今生让我来爱你若曦重生:带系统击穿甄嬛传后宫一生只求半称心掌中雀!惹上疯批权臣逃不掉龙斩深渊帝尊六界无敌暗夜荆棘妈咪救窝!坏爹地要给三宝上户口啦对照组觉醒!我靠内卷在七零赢麻了【cn】月光下的矢车菊并肩,三尺高台快穿:渣男改造进行中清冷炮灰?小黑屋在向你招手祈愿!寂静前的烟火,我看见了!原神之带着帝皇铠甲腰带穿越六零弹幕刷屏,嫁绝嗣大佬躺赢深宫亲历灵异小故事合集我靠驱邪写了本葬经炽念永恒反穿,流萤:我们清清白白!港岛情劫反派大佬拥有读心术后孟婆早餐店总裁护白月光?她一巴掌扇飞全场星轨共生体【无限】啊?我收主神?开局被拐,孤女带空间玩转古代穿成恶婆婆后,我成了全村的希望侯府吃绝户?她夺凤位屠尽白眼狼我赚够两千就下播,榜一大哥却急了万人嫌绝症后,雄竞修罗场炸了小玫瑰甜又欲,京圈大佬沦陷了直播算命算出爹,全网催我认豪门天枢神相御夫有术,豪门少爷轻轻宠不宫斗,只撸猫,暴君红眼失控了!阿娘系窝呀,崽崽捡到仙尊爹爹啦寒门宗妇回国后,沈总欲对我图谋不轨快穿:恶毒女配训狗手册病弱美人他今天也被贵族F4争抢重生之我在云都偷心三千次被疯批反派们强取豪夺了崩坏,镜流的王者大师兄盗墓:团欺的马甲不团欺恶女觉醒后,在男频文中嘎嘎乱杀四合院:悟性逆天,我下乡致富恶女撩又茶,五个妖夫抢着求我宠皇子请自重,太子封我做皇后了