Trevexia

围绕一个我尚未信任的模型构建一家机构,所学到的事。

Sam Singer20263 分钟阅读

2024 年春天,我遇到了一个我并不想要的问题。我在为自己旗下的两家事业、以及一只我担任顾问的基金跑外联,这项工作每周吞掉大约三十个小时。名单构建、文案起草、序列管理、回复分流——注意力的簿记。我知道这项工作之所以有结构,是因为我亲手为它建立了结构;我也知道任何被这样结构化的事物,必定有一种模型能够拟合的形态。那是一个星期天的下午,我开始为自己写一个代理(agent),八天之后,在一个星期一凌晨 3 点 14 分,我交付了第一个版本。它在第一周就替换了我手动外联工作的约三分之一。

这就是 Trevexia。那个八天写完的代理,从那以后已被重写过三次,但它为我回答的问题是:冷外联里有多少是手艺,有多少是与手艺无关的簿记?到第一个月末,答案是一个令人尴尬的比例。手艺是写作的声音,是判别「哪些信号才真正意味着某个客户进入了采购窗口」的眼力,以及「敢于走开一个在纸面上看着不错的潜客」的意愿。其余都是一台状态机。

我围绕这一区分构建了这家机构。Trevexia 接手簿记,把手艺还给人。代理负责名单构建、信号监控、序列编排、回复分类、日历协调。一位有品味的写作者——人——负责声音。两半通过一个队列对话。

我在最初六个月里所犯的错误,是假定操盘者是瓶颈。我设计这套系统时,假设一位销售人员能够吸收代理的输出并保持在心流之中。实际发生的是,代理浮现了比操盘者过往所见多十倍的「在采购窗口」的客户,操盘者被淹没了。手艺那一侧并非瓶颈。手艺那一侧是需要扩张以匹配新管道——比它过去习惯宽出一个数量级的管道——的那个表面。^footnote这条教训可以推广。每当一个模型显著提升工作流某一半的吞吐时,另一半在一周之内就会成为新的约束。与代理共事的工作,大多是围绕新约束重新设计,而不是为这次提升庆祝。

修复方式并不光鲜。我们必须重写「简报层」,以便一位操盘者能在一个下午里为一千个客户产出符合声音的文案。代理把单一创始人的声音切分为这周管道将要触达的八到十个原型情境——行业、岗位、信号类型、距上次接触的时间——然后操盘者针对这八到十个模板去写,而不是针对每一个具体客户去写。自由度的缩减,是让人这一侧在规模下仍然可行的关键。代理并不写出比一位优秀操盘者更好的文案。它减少了优秀操盘者必须作用其上的表面积。

代理并不写出比一位优秀操盘者更好的文案。它减少了优秀操盘者必须作用其上的表面积。

我没料到、但如今最为自豪的,是信号层。最初的代理是「序列优先」的:喂它一份名单,它产出一段序列。一个季度之内就明显看出,更好的问题不是「我们发什么」,而是「这个客户此刻正在做什么、说明它正在动起来?」融资事件。人员变动。页面阅读。岗位发布的增量。代理阅读世界,操盘者阅读代理。序列是下游的事。我对标过的多数机构,都从序列开始向后倒推。他们在优化问题中错误的那一半。

还有一项更安静、在 PPT 上更难辩护的学习,我一直在回到它。和代理一起做外联,会改变你阅读世界的方式。你开始把潜客视作时间序列,而不是记录。某个客户在你触达它那一天的状态,比该客户任何静态特征都更重要。代理的纪律是维护一份「两小时前」的世界模型。操盘者的纪律,是在那份模型上以一种「听起来不像自动化」的声音去行动——因为代理交付出去的任何东西,本身确实都不是自动化的。

不奏效的部分——也是我已经重建过两次的架构——是任何让模型做出一个清醒的人尚不信任模型去做的判断的环节。最初系统让代理决定丢弃哪些线索。从聚合层面看,丢弃率看起来合理,但残差却恰是最大笔交易所在之处。我们把模型从那项决策中抽了出来。人来丢弃,代理负责准备。这是一种模式:每一处我让模型对「判别步骤」拥有自主权的地方,代价都是长尾。2026 年的模型在「模态情形」上仍然出色,而在「边缘情形」上仍然不可靠。外联是一门关于边缘的生意。

Trevexia 现在进入了我愿意公开辩护的那一版本的第十八个月。它是一位操盘者、三位工程师、一个队列、一个写作系统、一个信号系统,以及一个被托付了「模型可被信任部分」的模型。我建造它是要弄清楚:一位拥有正确管道的人,能否胜过一支十人的外联团队。答案是:在模态情形上是,在长尾情形上否——这是大多数诚实的工具故事所得出的答案。当下的工作,就是长尾。

把它写在这里——一份本来关于「专注的纪律」的出版物——的理由是:这家机构是同一个问题的实务表达。一段工作流中,哪一部分奖励了模型擅长的簿记,哪一部分奖励了人擅长的专注,以及如何构建一种事物,让两者各司其职而互不污染。这才是底层问题。这家销售机构是关于该问题的案例研究,不是它的答案。

在线于 trevexia.com.