
「文科生也可以作念 AI」 「逆袭!」在中语互联网上,文科和 AI 的拉郎配,险些成了定番。
每隔一段时刻,这个标签就会被贴在某个东谈主身上,制造出一轮顷刻间的流量。要么是逆袭故事,要么是嘲讽素材,取决于驳斥区的感情。
一个标签,三种作念法
最新的案例是杨天润, AI 创业者,金融出生,正在斥地一个多智能体息争平台。他自称「一瞥代码都不会写的文科生」,搭建了一组 AI Agent,向 GitHub 上最热点的开源名目之一 OpenClaw 批量提吩咐码孝敬。

想考据一个假定:一个全都不懂时刻的东谈主,能不行仅靠教导 AI,就参与到顶级开源名目中去。
贬抑是:134 个 PR,21 个被合并,113 个被拒却。前几个 PR 质料还算可以,被珍视者招供并合并。但当他给 Agent 下了一条加快指示后,事情赶快失控——Agent 运行像活水线一样批量坐褥低质代码,在驳斥区放浪@珍视者催促审核。OpenClaw 经管员介入计帐,GitHub 随后修改了 PR 提交上限程序。

黑红亦然红,红过之后再黑愈加是。杨天润被包装成「文科生逆袭」的代表,而他本东谈主似乎也乐于接纳这个变装。在接纳品玩的采访时,他说了一句这么的话:
不懂代码反而是上风。AI 是梵高,你是个小画家,你有什么阅历告诉梵高中间该用什么笔触?

细想极恐。他把「不懂底层结构」意会为一种目田:不需要知谈系统在作念什么,只需要告诉它你想要什么。贬抑即是当 Agent 运行批量刷垃圾代码时,他连发生了什么都会诊不出来,因为他压根不知谈我方在操作什么。
他以为我方在教导梵高,实践上他在盲开一辆没装刹车的车,何况压根不知谈刹车在哪。
围绕这件事的讨论,也随之落入两个顶点:要么「文科生也能作念 AI」,要么「文科生别碰 AI」;前者是越过鸿沟的豪举,要么是掉进鸿沟的见笑
如若咱们对「文科生作念 AI」的设想力独一这些,那不免太枯竭了。
Claude 为什么需要一个形而上学家
咱们之前写过,Anthropic 的办公室里,有一位正经八百的文科生,深度参与了 Claude 的修复。不是测试它能不行写代码,不是查验它的数学能力,而是和它进行漫长的、对于价值不雅、对于措辞分寸、对于「濒临不细目性应该如何抒发」的对话。
Amanda Askell,苏格兰东谈主,本年 37 岁。她的处事旅途自身即是一个不太寻常的故事:在大学,她率先学的是好意思术和形而上学,自后转向纯形而上学,在牛津拿到了 BPhil,又在纽约大学拿到了形而上学博士。她博士筹商的是无尽伦理学中的帕累托原则:当触及无尽数目的谈德主体或无尽时刻跨度时,伦理排序应当除名什么程序。

这听起来像是距离硅谷最远的学术宗旨,但她先后加入了 OpenAI 的策略团队和 Anthropic 的对皆团队。2021 年起,她成为 Anthropic「本性对皆」团队的发达东谈主,职责要点是塑造 Claude 如何与东谈主类对话、如安在不细目时抒发态度、如安在价值不雅打破中作念出判断。2024 年,她入选了 TIME100 AI 榜单。《华尔街日报》神气她的日常职责是「学习 Claude 的推理模式,用长度特出 100 页的指示词来修正它的活动偏差」。传说她是这个星球上和 Claude 对话次数最多的东谈主类。
为什么一个 AI 公司需要一个形而上学家来作念这件事?谜底藏在一些相配具体的时刻选拔里。
本年 1 月,Anthropic 发布了一份长达 80 页的文献,被称为 Claude 的「宪法」。媒体关怀的是文献末尾对于 AI 意志的意象——诚然,雇主 Dario Amodei 也话里话外「示意」这少量。

但更值得提防的是它的底层逻辑:教 AI 意会为什么要这么作念,比告诉它应该怎样作念更灵验。这是一个时刻判断,以为内化价值比驯服程序能产出更可靠的活动,而这种判断的常识根基,来自一个学好意思术、学形而上学的东谈主。
Amanda 的案例报告了一个问题:被视为「不消」的学科常识,能否成为时刻系统的中枢能力?谜底不仅是能,何况,莫得她的形而上学磨练,Claude 的对皆问题用现存的工程方法经管不了。
被再行定名的学科
如若 Amanda 的故事评释了,某些被归为「文科」的学科磨练可以是 AI 的中枢能力,那么林俊旸的故事要说的是一件更垂危的事:有一所有这个词学科,一直在大模子时刻栈底层运行。
林俊旸离开放义千问后,中语互联网的报谈反复使用归拢个说法:他有期骗谈话学布景。稍稍传几次,这个话就变形了,形成了他是「文科生」。

这个标签和杨天润身上贴的是归拢个,但其实被严重歪曲。
林俊旸学的是谈话学,这是一个伞状学科,它的分支掩盖谈话教会、谈话策略、翻译筹商,也包括狡计谈话学。可以说,狡计谈话学,即是当然谈话处理(NLP)之子。

乔姆斯基在 1950 年代提议了体式语法,OD体育app这个表面用具径直催生了早期 NLP 的句法分析时刻;Daniel Jurafsky 和 Christopher Manning,这两位 NLP 范畴被援用最多的两本教科书的作家,都是谈话学出生。

乔姆斯基
换句话说,「学谈话学的东谈主去作念 NLP」就像「学物理的东谈主去作念芯片遐想」一样,是一条正宗旅途,不是跨界。
阿谁「只怕感」全都是中国语境制造的。高考文理分科的轨制惯性,把「谈话学」塞进了「文科」的心智模子里。但谈话学的中枢方法论——体式化、统计建模、语料标注——本色上是工程想维。林俊旸在北大的互助者孙栩、苏祺,都是 NLP 宗旨的筹商者;他 2019 年加入达摩院时插足的是 NLP 团队。这不是一个文科生误入时刻范畴的故事,从一运行就不是。
比「林俊旸不算文科」更值得张开的,是谈话学在大模子时刻栈里实践饰演的变装。它比大巨额东谈主以为的要深得多,也荫藏得多。
比如分词。所有谈话模子处理文本的第一步,是把输入切成模子能处理的基本单位。对英语来说,空格提供了自然的词鸿沟,看起来浅薄。但中语里,莫得空格,且每一个标点记号的用法,都可以傍边句子的抒发真理。
「我在北京大学念书」是切成「我/在/北京/大学/念书」照旧「我/在/北京大学/念书」?这不是一个有圭臬谜底的工程问题,它取决于你对中语词汇结构和语义单位的意会。
2024 年底有筹商者特意发表论文,讨论如何优化 Qwen 模子的阿拉伯文分词成果,因为通用有琢磨在处理这类谈话时成果显贵下落。Qwen 系列在多谈话上的成见,不是把所有谈话当英语的变体来处理,而是基于对谈话间结构性各异的意会,作念出的遐想选拔。

又比如响应对皆。RLHF 历程中,标注员需要判断模子的两个报告哪个「更好」。这个判断听起来主不雅,但它背后有一套谈话学也曾筹商了几十年的框架:语用学。
标注员在评估「好的报告」时,实践上是在判断互助原则——报告是否提供了饱和但不外量的信息?会话含义——报告是否捕捉到了用户真确想问的、而不单是是字面上问的东西?语境适切性——相似的内容,用这种风物说在这个场景下是否多礼?
「Helpful, Harmless, Honest」这套被过去使用的对皆圭臬,本色上即是语用学基本原则的工程化翻译。

从林俊旸的学术轨迹中,也能看到一种相配谈话学的筹商作风。他主导的 OFA(One For All),2022 年发表于机器学习范畴的顶级会议 ICML,于今被援用近 1500 次。这个职责的中枢想路不是为每个任务搭专用有琢磨,而是用一个饱和通用的序列到序列框架,把图像生成、视觉定位、图像神气、文天职类等跨模态任务长入起来。

从 OFA 到 Qwen-VL(被引特出 2200 次),再到 Qwen2.5,以及最新的 3.5,一条明晰的陈迹连络恒久:与其为每个问题发明一套特意的解法,不如找到一个饱和好的通用框架,让所有问题在归拢个框架里被经管。
用最少的程序,掩盖最多的征象——这正是谈话学几十年来的中枢追求。生谚语法的一谈学术贪念,即是找到一套有限的程序系统,不祥生成无尽的谈话抒发。OFA 的架构形而上学与此同构,为每种谈话征象写一套特意程序并不现实,应该寻找一个底层框架来长入它们。
林俊旸作念大模子作念得好,不是因为谈话学布景「也能」作念 AI,而是谈话学磨练塑造了一种特定的学术品尝,对长入性和体式化的偏好。这种品尝在大模子期间,碰劲是中枢竞争力。
看不见的地基,看得见的需求
三个东谈主,归拢个标签,三种全都不同的结构。
杨天润不懂底层结构,把「不懂」当上风,贬抑失控。这是「文科生作念 AI」的空壳版:标签制造了流量,但莫得任何学科磨练在起作用。他的故事体现的恰正是——当「文科生」只是一个营销标签时,会发生什么。
Amanda Askell 的形而上学磨练组成了对皆问题的中枢方法论。莫得她,Claude 不是 Claude。她的故事报告的问题是,被视为「不消」的学科常识,能否成为时刻系统的中枢能力。谜底是不仅能,何况不可替代。
林俊旸的谈话学磨练组成了大模子时刻栈的隐性基础门径。他的「文科布景」从来不是跨界,是正宗旅途。他的故事报告的问题是,文科对于先进时刻的孝敬,到底「隐性」到了什么进程,它是不是正在变得显性。
而终极问题并不是「文科生能不行作念 AI」,而是咱们能否意会到少量:靠名义上的「有莫得用」来评判常识和学科,也曾落伍了。
跟着大模子从追求能用好用,走向追求可靠和可控,这些被归入「文科」的学科磨练,价值不是在减弱,而是在扩大。模子越渊博,越需要精准的评估体系来会诊它在那儿、为什么出错,也越需要意会谈话和真理的复杂性来遐想更好的磨练数据,越需要在对皆问题上作念出有学科明锐度的判断。
「文科生逆袭」这个叙事——不管是赞扬照旧讽刺——潜藏了真确在发生的转向:看不见的地基OD体育app,正在形成看得见的需求。
开云体育官方网站 - KAIYUN