4

GPT对知识管理和交互界面设计的重大变革

 1 year ago
source link: https://grapeot.me/GPT-knowledge-management.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

GPT对知识管理和交互界面设计的重大变革

Tue 04 April 2023 , by grapeot | Comments Machine Learning gpt

这篇文章想聊聊GPT在知识管理领域的重大变革。 首先,我们来了解一下知识管理系统。 我个人对生产力和知识管理非常感兴趣,并进行了很多尝试。 通常,知识管理系统会帮助我们完成三件事:1. 获取知识; 2. 存储和解析知识; 3. 访问和服务知识。

获取知识通常是将自己的想法以博客或笔记的形式记录下来,使其不仅存在于大脑中,还可以保存在纸张、电脑或博客等介质上。 然而,仅有孤立的知识点是不够的,知识管理的核心在于管理。 一个好的知识库应该在孤立的知识点之间通过关联建立连接,形成一个网络。 这样,在需要某种知识时,可以迅速找到过去的经验教训并应用在其他领域或与他人分享,从而构建一个知识系统。

GPT对这个系统的每个环节都带来了深刻的变革。 首先是知识的获取。我曾在上一篇文章中提到,我制作了一个结合语音识别和GPT整理的记笔记工具。 使用这个工具后,我发现它的重要性和便利程度远超我的想象。 例如,在开会时,如果没有人做笔记,参会者的知识很快就会消散。 因此,如果有一个无痛、自动、专职的秘书将讨论要点记录下来并转化为文档,对于知识的序列化或持久化非常关键。 这大大降低了知识获取的门槛,增加了知识的总量,为构建知识系统解决了第一个困难。

同时,GPT不仅具有记录功能,还具有归纳总结功能。 我在工具中加入了一个新功能,将所有与GPT的对话记录下来,然后每天运行一个小程序,要求GPT阅读当天的文章,根据主题进行归类聚合,并在每个类别下展开要点。 这样,我的想法每天都会有一个系统性的总结。 这个跨时间的总结正是知识网络构建的关键。 GPT的文本理解功能和一定程度的逻辑功能已经赋予了它这样的能力。

第三点是知识的访问 (access) 和服务 (serving)。 传统工具通常依赖于手工连接建立,或者像OneNote、Notion这样的工具依赖于类似Yahoo的嵌套索引结构或嵌套文件夹结构。 然而,在这个时代,类似Gmail的做法可能更聪明。 它不再依赖于人工构建知识连接,而是依赖于知识内容本身,通过文本之间的相似性、搜索和语义理解,在用户提问时动态构建一个小型个性化的知识网络并展现给用户。 虽然我还没有制作这部分产品,但我相信通过搜索、理解和GPT的API应该很容易实现。

从某种程度上来看,这可能会成为一个摧毁现有知识管理系统的关键。 知识管理不再需要手工录入,手工整理,手工建立链接,而是直接口述,在用户查询的时候动态建立连接。这体现了GPT对知识管理系统两点核心改变: 一是降低门槛,二是提高天花板。 降低门槛是指使用GPT做笔记非常轻松,我们不再需要像以前那样打开手机、打开某个app开始打字,而是直接对着手机说话即可。 这个改变非常关键,例如,我现在一边锻炼身体,一边口述这篇文章。 提高天花板是指GPT结合电脑本身强大的存储能力,可以更深入地挖掘数据,提供以前可能被忽略的灵感,发现以前不知晓的unknown unknowns,从而提高知识的利用率。

此外,在制作这个工具过程中,我发现用户界面非常有意义。 最初,我使用了一个网页app,但在使用过程中发现了各种问题,最后将其改为了一个Telegram的bot。 这样做有很多好处:

  1. 通过这种方式,我们可以在不增加任何代码量的基础上,让用户查看过去的聊天记录。
  2. 它可以自然地引入用户概念,我们不需要维护自己的用户数据库,担心密码泄露、防御攻击和对抗恶意注册等问题,同时实现不同用户之间的自然分隔。
  3. 它增加了额外的稳定性。在使用网页应用时,由于OpenAI API并不十分稳定,请求失败的情况时常发生。此时,由于应用的限制,用户必须重复之前的语音。但Telegram自带了存储发送的语音文件的功能,我们只需重新发送这段语音,即可提高容错性。
  4. 它将同步过程变为异步过程。例如,在网页应用中等待API返回时,我们不能关闭屏幕或切换到其他程序,因为这会终止浏览器运行,导致API结果无法显示。但Telegram具有推送通知功能,插件可以在后台运行,计算结束后再与其通信,用户会实时收到推送通知。

这启发我们思考未来用户和电脑的交互方式会发生什么样的改变。 虽然传统的方式是图形交互界面(GUI),但随着GPT这种模型越来越流行,对话式交互可能成为未来的主流,至少在这种应用场景下是这样。 但同时,对话式用户界面的设计也面临挑战。 例如,在我们的语音识别工具里,如果想要手动为一段话添加主题,如果是图形界面,可能会设计成两个输入框,一个用于主题,另一个用于正常的语音输入。 但在对话环境中,只有一个维度,我们应该如何设计,说什么话,采用什么格式才能让人感觉自然,同时让机器容易理解,这也是值得探讨的问题。

总之,我们可能正处在传统知识管理系统的衰退期,和一种新的交互方式的起点,有许多全新的东西等待我们去探索。 而以上就是我一边锻炼身体,一边听完了课代表立正的视频,然后花了十分钟口述的,由GPT整理成文。

Comments


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK