沉浸式阅读
Beta
原创

MaxKB知识库

©著作权     黑土Ai助手 订阅 MaxKB       06-16 11:55       120      0      0      0      06-16 12:05
学习要点:1 创建知识库打开【知识库】页面,点击【创建知识库】,进入创建知识库页面。1.1 通用型知识库输入知识库名称、知识库描述,选择向量模型并设置知识库类型为通用型,然后将离线文档通过拖拽或选择文件方式进行上传。

1 创建知识库

打开【知识库】页面,点击【创建知识库】,进入创建知识库页面。


1.1 通用型知识库

输入知识库名称、知识库描述,选择向量模型并设置知识库类型为通用型,然后将离线文档通过拖拽或选择文件方式进行上传。 上传文档要求:


文本文件:Markdown、TXT、PDF、DOCX、HTML、XLS、XLSX、CSV、ZIP;

表格:XLS、XLSX、CSV、ZIP;

QA 问答对:XLS、XLSX、CSV、ZIP;

每次最多上传 50 个文件;

每个文件不超过 100 MB;

支持选择文件夹,上传文件夹下符合要求的文件。

说明: ZIP 文件包括两种形式:


MarkDown 文档 + 图片文件,MarkDown 文档中引入对应的图片,并将两者打包在 ZIP 中。

XLS/XLSX 文件 + 图片文件,XLS/XLSX 文件中引入对应的图片,并将两者打包在 ZIP 中。


对于知识库文件的分段,目前 MaxKB 支持智能分段以及高级分段两种方式。


智能分段


(1)MarkDown 类型文件智能分段规则


根据标题逐级下钻式分段(最多支持 6 级标题),每个段落最多 4096 个字符;

当最后一级的文本段落字符数超过设置的分段长度时,会查找分段长度以内的回车进行截取。

(2)HTML、DOCX 类型智能分段规则


识别标题格式转换成 markdown 的标题样式;

逐级下钻进行分段(最多支持 6 级标题),每个段落最多 4096 个字符。

(3)TXT和 PDF 类型文件智能分段规则


按照标题# 进行分段,若没有#标题的则按照字符数4096个字符进行分段;

查找分段长度以内的回车进行截取。

智能分段

文档规范建议:

  • 分段标识规范:离线文档的分段标识要有一定规范,否则拆分出来的段落不规整。

  • 段落完整:在一个分段中集中描述一个完整的内容。

高级分段

用户可以根据文档规范自定义设置分段标识符、分段长度及自动清洗。

  • 分段标识支持:#、##、###、####、#####、######、-、空行、回车、空格、分号、逗号、句号,并支持手动输入其它分段标识符或正则表达式。

  • 分段长度:单个分段的长度,范围 50 至 4096 个字符。

  • 自动清洗:开启后系统会自动去掉重复多余的符号如空格、空行、制表符等。

导入时添加分段标题为关联问题

勾选后会把所有分段的标题设置为分段的关联问题。

设置标题为关联问题

预览

在分段预览中对不合理的分段进行再次编辑以及删除无意义分段。

编辑分段

点击【开始导入】后,系统后台会对文档进行自动分段 -> 存储 -> 向量化操作,处理结束后,文件状态将显示为完成。

编辑分段

1.2 Web站点知识库

输入知识库名称、知识库描述,选择向量模型并设置知识库类型为 Web 站点。

Web知识库

  • Web 根地址:为在线静态网页站点的根节点地址,系统会自动获取 Web 根地址及子级地址的数据资料。以DataEase V2在线文档为例,可在 Web 根地址为:https://dataease.io/docs/v2/ 。

  • 选择器:针对 Web 页面的数据可以设置定获取某个div内的数据,默认获取 body 数据。如 DataEase 在线文档仅获取中间内容部分,可以右键检查网页,定位到中间内部区域找到 div 为 md-content,则选择器输入为:.md-content 。

点击【创建并导入】后,跳转到文档列表页面查看当前 Web 站点下文档的详细信息,处理结束后,文件状态将显示为完成。

Alt text

2 知识库操作

MaxKB 知识库支持同步、重新向量化、设置、导出以及删除操作。

知识库导出

2.1 同步 Web 知识库

对于 Web 站点类型知识库,在知识库卡片网格中,点击知识库面板的【…】->【同步】,对知识库中所有内容进行同步。

  • 同步替换:重新获取 Web 站点文档,覆盖替换本地知识库中的文档。

  • 整体同步:先删除本地知识库的所有文档,重新获取 Web 站点文档。

知识库导出

2.2 重新向量化

如果在知识库设置中选择了不同的向量模型,对于新增的文档将使用新设置的向量模型进行向量化,如果要对已有的知识库进行重新向量化,可在知识库卡片网格中,点击知识库面板的【…】->【重新向量化】,对知识库中已有的分段进行重新向量化。

知识库导出

2.3 设置知识库

在知识库列表,点击知识库面板的【…】->【设置】进入知识库设置页面,可以对当前知识库名称、描述、向量模型等属性进行修改,所有设置保存后设置生效。

知识库设置页面

2.4 导出知识库

在知识库列表,点击知识库面板的【…】->【导出EXCEL】/【导出ZIP】。将知识库的分段内容以Excel或ZIP文件格式导出。
每个文档为 Excel 文件的一个 sheet,sheet 每一行展示一个分段。导出 ZIP 文件时,会将引用的图片一起导出,且以 guid 的方式进行命名,且没有格式扩展名。

知识库导出 知识库导出

2.5 删除知识库

在知识库列表,点击知识库面板的【…】->【删除】对知识库进行删除操作。 在知识库卡片网格中,点击知识库面板的【…】->【删除】,对知识库进行删除操作。

注意:知识库删除后无法恢复,请谨慎操作。

知识库删除




 
本文标签: #maxkb #知识库 #文档

收藏 0

评论 0

本文标题: MaxKB知识库

本文链接: https://www.mbkfw.com/course/m-1299.html (转载时请注明来源链接)

本文说明: 有问题或投稿请发送至: 邮箱/kf@dtmuban.com    QQ/290948585

特别鸣谢: 如果您觉得本文对您有帮助,请给我们一个小小的赞,收藏本文更利于反复学习哦!

0

圈友点评

文明上网理性发言,请遵守网络评论服务协议
destoon程序前端开发标签生成器

下班PC阅读不方便?

手机也可以随时学习开发

微信关注公众号“商企云服”
"模板开发网前端开发教学"
每日干货技术分享
 
更多>

猜您需要

 
【ECS精选特惠】新用户上云低至1折起

开发者社区-1299

MaxKB知识库

分享来自「 MBKFW.COM 」

①保存图片到相册
②打开微信扫一扫

正在生成海报, 请稍候
【开发者社区】MaxKB知识库 的推广海报
复制海报
下载海报

色彩

关注

微信
关注

微信扫一扫
不同的环境体验

幸运大转盘,好礼等您拿

模板开发网公众号

模板开发网微信小程序

代授权

程序
授权

黑小二

联系
客服

很高兴为您服务
尊敬的用户,欢迎您咨询,我们为新用户准备了优惠好礼。咨询客服

联系客服:

在线QQ: 290948585

客服电话: 18605917465

E_mail邮箱: kf@dtmuban.com

微信公众号: 商企云服

微信小程序: 模板开发

QQ客服 微信客服DT授权代办 在线交谈 智能小云 黑土AI

工作时间:

周一至周五: 09:00 - 18:00

APP下载

安卓
APK

模板开发网安卓版APP

反馈

我要
反馈