• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

通过ChatGPT实现的ChatPDF,的应用落地,让你的文档变成智能助手,通过对话的方式快习文档内容

武飞扬头像
程序员阿伟
帮助3

目录

先看效果

实现原理

环境安装

应用场景


先看效果

首先,找到一篇论文先,我这里随便找了一篇pdf格式的论文

学新通

那么,我现在让他担任一个研究论文的智能助手,当然大家可以自定义自己的prompt

学新通

 开始问答

学新通

可以看到效果很强

实现原理

  1. 提取 pdf 文本,以便后续处理。
  2. 由于 OpenAI API 对 Token 数量有限制,我们需要将 PDF 文本切分成小于 Token 限制的片段。
  3. 将每个片段使用 OpenAI 的 Embedding API 生成向量并保存到数据库(Postgres)中
  4. 开始提问题
  5. 将用户提出的问题转换为向量。
  6. 使用余弦相似度算法将用户提出的问题向量与数据库中的向量进行比较,找到与问题最相似的文本片段。
  7. 将片段文本喂给 ChatGPT,让它基于这些片段回答用户提出的问题。

代码资源,我放在网盘了,大家需要的自提

链接:https://pan.百度.com/s/1Os_DR8lC9gBtc2ONNN5YJg?pwd=6666 
提取码:6666 
--来自百度网盘超级会员V1的分享

环境安装

python环境3.7 的,我这里是3.8

pip install -r requirements.txt

学新通

 如果说,运行发生ssl错误的话

可以对urllib3进行降级

pip install urllib3==1.25.11

 执行代码是这个

学新通

 然后的话,大家就需要特殊上网了,因为本质上还是使用到openai的

学新通

 使用前的话,我们需要将自己的语料喂给openai,只需要喂一次就行,如果更换语料的话就需要重新喂了

 喂养,第二次使用就可以注释掉

学新通

另外运行前需要将自己的key更改成自己的

学新通

应用场景

可以通过这种上传文件的方式,解决openai的token的字数限制问题,让我们的文档变成一个帮助你学习的助手,当然其他的一些可以用来创业的想法,大家可以自行的去研究。

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanheheckj
系列文章
更多 icon
同类精品
更多 icon
继续加载