2

语言模型debug开源工具- Transformer Debugger

 6 months ago
source link: http://osp.io/archives/8421
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Transformer Debugger (TDB) 是由 OpenAI 的 Superalignment 团队开发的一种工具,旨在支持对小型语言模型特定行为的调查。该工具将自动可解释性技术与稀疏自动编码器相结合。基于Python编写,遵守MIT开源协议。

h8_439655.jpg@596w_1l.jpg

Transformer Debugger (TDB)能够在需要编写代码之前进行快速探索,可以用于回答“为什么模型对于这一提示输出了令牌 A 而不是令牌 B”之类的问题。通过识别对行为有贡献的特定组件(神经元、注意力头、自动编码器 latents),显示自动生成的解释来分析导致这些组件最强烈激活的原因,并跟踪组件之间的连接以帮助人们发现联系,以此来帮助人们进行 Transformer 的 debug 工作。

源代码:https://github.com/openai/transformer-debugger

No Comments Yet

发表回复 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注

显示名称 *

电子邮箱地址 *

网站地址


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK