文:Web3天空之城| 未经许可不得转载
【城主说】如主持人所言, 在这次访谈开始前的一小时,OpenAI再次进行了一系列产品发布。这种紧凑的迭代节奏已成为AI竞赛“场上选手”的常态-如果没能保持这种节奏,那恐怕就不是AI主要玩家了。
作为幕后推手,OpenAI首席产品官凯文·威尔(Kevin Weil)在这次访谈里再次阐明了ChatGPT的演进蓝图:它将不再是一个被动的问答“先知”,而是能够接入你的个人与企业数据,主动为你执行现实世界任务的智能“员工”。
终极愿景:从“先知”到“员工”的进化
长久以来,我们习惯于将ChatGPT视为一个无所不知的先知(Oracle),我们提问,它回答。然而,凯文·威尔指出,这仅仅是AI能力的初级形态。OpenAI的真正目标,是将其打造成一个能够理解上下文、接入工具、并主动执行多步骤复杂任务的智能代理(Intelligent Agent),其角色更像一个高效的数字员工。
这一转变的基石,在于将模型与用户真实的工作流和数据源打通。最新发布的连接器,允许ChatGPT接入Google Docs、SharePoint、Gmail等关键生产力工具,意味着它终于获得了与人类员工同等的“信息权限”。当一个AI拥有了项目的完整背景、团队的沟通记录和公司的知识库,它的价值便从“回答问题”跃升至“解决问题”。这不仅是效率的提升,更是工作模式的颠覆。
我们今天早上发布的最重要的一件事……是我们推出了一系列连接器,它们可以连接到您的个人数据,或者,如果您是企业,则连接到您的企业数据。在您的公司里,您绝不会有员工是您不赋予文档访问权限的。那里就像是对话、策略和其他事务的发生地。所以现在您有了 ChatGPT,它也具备了这种能力。
另一个重要部分是,ChatGPT应该能够执行操作……并最终将所有这些整合起来,开始真正像一名员工一样工作。这就是线索,对吧?将ChatGPT从一个我们通过提问与回应进行互动的东西,转变为一个更高级、感觉它真的像一名员工一样为我们工作的方向。
构建之道:在“混沌”与“迭代”中寻找未来
与传统软件开发不同,OpenAI的产品路径并非由一份清晰的产品需求文档(PRD)主导。凯文·威尔坦诚,这是一种在不可预测性中构建未来的全新模式。他将之形容为研究、产品与工程团队之间的一种紧密循环,而这种模式的核心,是迭代部署(Iterative Deployment)的哲学。
外界常常对ChatGPT左上角那个“混乱”的模型下拉菜单感到困惑,但这正是其开发理念的直观体现。OpenAI选择将尚不完美但具备前沿能力的新模型快速交到用户手中,以此加速学习循环。用户的使用行为、遇到的问题,都成为最宝贵的评估(evals)数据,反哺给研究团队,用以校准和改进模型。这种方式虽然牺牲了简洁性,却换来了无与伦比的迭代速度。
这种由研究驱动的开发模式,意味着产品团队对未来6个月后的规划是模糊的,因为颠覆性的能力可能在任何一次训练中“涌现”出来。这要求产品经理具备一项新技能:为复杂、甚至是主观的任务(如创意写作)创建有效的评估体系,以此来衡量和引导模型的演进方向。
在这里工作最有趣的一点就是……你只能隐约从迷雾中看到一些未来的发展。有时候,能力是……这是研究,对吗?所以这不像你只是拥有一个公式,然后机械式地操作就行,我们正在发现新事物,而且这是不可预测的。
我认为是OpenAI真正神奇的地方:当一个研究团队和一个产品与工程团队齐聚一堂,共同发挥他们独特的技能……研究团队则采纳这些信息,并利用其改进模型本身。于是你就形成了模型朝着特定产品改进的这种紧密循环。我认为我们最好的产品都是通过这种方式构建的。
赋能之力:用AI代理重塑行业与个人
如果说让ChatGPT成为“员工”是宏大愿景,那么AI代理(Agent)则是实现这一愿景的具体载体。凯文·威尔用新近推出的软件工程代理Codex为例,生动地展示了其巨大威力。他本人,一个已非全职的工程师,在深夜利用Codex,仅用10分钟就修复了一个他从未接触过的语言编写的Bug,并成功提交了代码。
这正是AI代理的核心价值:它不仅仅是工具,更是能力的延伸和放大器,旨在普及专业技能”(democratizing skills)。威尔畅想,当编写代码的能力从全球三千万开发者普及到十亿人时,无数在疫情期间因缺乏技术能力而陷入困境的小型组织和个人,将能在一夜之间构建起解决自身问题的工具。
对于外界担忧OpenAI这类平台会挤压初创公司生存空间的“平台悖论”,威尔引用了微软Windows 95集成TCP/IP协议栈的经典案例。他认为,平台提供更强的基础能力,是将开发者从“重复造轮子”的底层基建中解放出来,让他们能更专注于创造真正独特的价值。对于创业者而言,真正的机会在于在模型能力的前沿进行构建,即利用那些当前模型“勉强能用”,但下一代模型将使其大放异异彩的新能力。
当你可以让这个软件代理,比如说,为你实际解决现实世界的任务时,它就体现了这种东西的力量。与此同时,我还在写邮件、在 Slack 上跟进……所以这纯粹是额外增加的价值。
如果你正在创办一家公司,并且你正在模型能力的前沿进行构建,如果你正在构建一个勉强能用,并且你迫不及待地等待我们下一个模型的产品,因为你知道它会让你的产品大放异彩,那么你很可能就处在正确的方向上。
在对话的最后,当被问及通用人工智能(AGI)何时到来时,凯文·威尔给出了一个冷静而深刻的回答。他认为,AGI的到来不会是一个“一夜之间”的突变事件。相反,它是一个我们正在亲身经历的渐进过程。正如我们所见,AI正在以惊人的速度,在越来越多的维度上超越人类。
天空之城全文整理版
主持人
: 今天,我非常高兴地欢迎凯文·威尔。他是OpenAI的首席产品官,此前在Twitter和Facebook等公司拥有斐然的职业履历。有太多要谈的了。凯文,首先感谢你抽出时间。你今天已经很忙了。旧金山现在是早上,你们已经发布了一些东西了。
凯文
: 是的,我们是。非常感谢你们邀请我。这是我第一次参加现场Substack活动。所以我很高兴。嗯,希望未来还有很多次。
主持人
: 你们真的让我们时刻保持警惕。就在我们上线前一小时,OpenAI又进行了一波产品发布。这些发布告诉我们什么关于你们对ChatGPT的愿景以及这款产品的走向?
凯文
: 我们今天早上发布的最重要的一件事是,我们今天早上发布了大约六种不同的东西。但我认为,对人工智能的长期未来而言,最重要的是我们推出了一系列连接器,它们可以连接到您的个人数据,或者,如果您是企业,则连接到您的企业数据。这些连接器可以连接到 Google Docs、Gmail 和日历、SharePoint、OneDrive、Dropbox、Box、Linear,以及所有这些您日常用于完成工作的不同工具。随着我们推理模型的兴起,将它们连接到您使用的服务和数据中,大大提升了模型的效用。
所以不仅仅是,比如说,在工作中,如果您将其连接到您的 Google Docs 或 SharePoint,连接到您日常使用的文档中,您现在就可以提问。突然间,ChatGPT 就能获取所有这些关于企业、项目状态以及任何特定事态最新情况的语境信息。在您的公司里,您绝不会有员工是您不赋予文档访问权限的。那里就像是对话、策略和其他事务的发生地。所以现在您有了 ChatGPT,它也具备了这种能力。而目前,它们是只读的。所以它们能够访问信息,但无法进行创建操作。但你可以想象未来会是怎样。
另一个重要部分是,ChatGPT应该能够执行操作,应该能够帮助你撰写文档,制作演示文稿,或者,你知道的,将任务写入你的任务管理系统,并最终将所有这些整合起来,开始真正像一名员工一样工作。对。所以就是这样。这就是线索,对吧?
主持人
: 将ChatGPT从一个我们通过提问与回应进行互动的东西,转变为一个更高级、感觉它真的像一名员工一样为我们工作的方向。我们会花一些时间深入探讨。这是一个多么宏伟的愿景。
愿景与感受:在AI浪潮之巅做产品
主持人
: 让我问问你。你是当今世界上我认为最重要的公司的首席产品官。
凯文
: 那么,对你而言,日复一日、周复一周地感受如何?我觉得,这是一种荣幸。这是我工作过最激动人心的地方。在我的职业生涯中,我非常幸运,能在许多很棒的地方与非常优秀的同事共事。但我认为,摆在我们面前的机会,以及人工智能改变我们所有人生活的速度,意味着我们有能力产生真正巨大的影响。我们对此非常重视。所以我能与杰出的同事们一起工作。我能亲身见证我们的模型如何演进,以及这一切如何影响我们的生活。希望我们能开发出一些产品,为你的生活以及所有在此聆听的人们的生活带来改变。
主持人
: 那么,自2022年11月以来,将近十亿人至少是通过口头传播和指尖操作选择了使用ChatGPT。科技总是在改变我们。电视就做到了这一点,我们有了电视晚餐和饮水机旁的闲聊。互联网显然以不同的方式改变了我们,汽车亦是如此。我们有了大型连锁超市,有了郊区,有了尖桩篱笆,以及《绝望主妇》。那么,AI产品将如何重塑我们的日常生活呢?
凯文
: 嗯,我认为当科技浪潮来临时,另一个有趣的现象是,人们会先用新的媒介去做他们以前在旧浪潮中做的事情。你知道,最初的电视广告就是人们站在舞台上,宣读他们的广播广告。然后人们慢慢地发现,你实际上可以制作出我们今天看到的商业广告,它们更具互动性,也更具动感。所以,你知道,我们可能仍然处于这样的模式中:当人们审视AI能对他们的生活或工作产生的影响时,他们会想:“好吧,我有这些流程。”我该如何将AI赋能于此,使其变得更好、更快等等。那没关系。这都挺好的。
就像之前的技术转型一样,其力量来自于利用这项新技术,从第一性原理出发彻底重新构想你正在做的工作。你知道,所以移动技术并不仅仅是,你知道的,一个装在口袋里的电脑。它是,你知道,你可以使用GPS,并且拥有全新的通知方式以及与技术互动的全新方式。我认为在接下来的,你知道的,一年里,我们都将处于利用人工智能重塑做事方式的过程中。而有趣的是,这项技术发展得如此之快。不,我的意思是,它的发展速度比我职业生涯中接触过或见过的任何技术都要快。所以即使我们正在重塑,这项技术也正在获得新的能力。这简直就是一个激动人心的时代。
重塑日常:AI如何改变我们的行为模式
主持人
: 我的意思是,这种变化的速度确实非同寻常。我确实如此。我今天在寻找一些东西,我知道这在四个月前是不可能实现的。所以我当时正在使用O3来帮我寻找一款小型便携式5G移动路由器,以备我旅行时需要获得高质量信号之用。而且,O3深入探讨了射频芯片组的所有技术规格,并说,你知道,这款较早的路由器配备了他们现在已不再使用的略微更好的高通芯片组,你将在美国的乡村环境下多获得一格信号,但在欧洲则不行。我坐在那里,心想,这简直有点疯狂。
但我对这类行为模式确实很好奇。你看到了你的用户在使用ChatGPT时出现了哪些令人惊讶的行为?萨姆已经就代际差异略作探讨,但请让我们了解一下你在行为方面学到的那些产品团队很难事先研究或弄清楚的事情。
凯文
: 嗯,我确实认为,我的意思是,萨姆谈论过,就像我说的那样,现在很多人都只是将人工智能零星地应用于他们现有的工作流程。而且,你知道,对于年轻人来说,这(指人工智能)是他们与生俱来的,而对于我们这些在没有人工智能环境下成长的人来说,则并非如此。我的孩子们就是觉得,当然了,你可以和一个超级强大的AI对话,它能够自行定制,并回答你提出的任何问题。如今大学毕业的那些工程师,他们写代码除了使用像Cursor和Windsurf这样的AI编辑器之外,不知道还有其他什么方式。对他们来说,这简直是再自然不过的事了。因此,这在某种程度上赋予了他们超能力。这也是我们非常关注最年轻的用户,比如青少年后期和大学生群体是如何使用产品的原因之一,因为这能教会我们很多东西。不过,你能否描述一下这些差异呢?
主持人
: 那么,如果你二十岁出头,在使用ChatGPT时,会是什么感觉呢?与那些可能三十多岁或四十出头的人相比,这种感觉有何不同?
凯文
: 这有点像一种‘始终在线’的特性,你只是意识到你的口袋里有一个超级助手,它不仅能回答任何问题,还能教会你任何你想学习的东西。所以当你以这种方式生活时,我们其他人还在努力记住,努力思考我们所经历的过程,以及我们如何能够重新构想它们。如果你更年轻,你可能还没有经历过这些过程。因此你用人工智能从零开始构建了它们。所以它就成了你生活运作方式的核心部分。在某些方面,他们是领先的,而我们其他人正在迎头赶上。
建立信任:直面恐惧与迭代部署的哲学
主持人
: 很多人都害怕这项技术。很多人都感到,你知道的,紧张。我刚从布鲁塞尔回来,和不同行业的人交流过,你确实能感受到那种恐惧。产品中可以做出哪些改变来解决这个问题?
凯文
: 我认为非常重要的一点是,人们会问,你知道的,关于人工智能我该怎么做?我该如何看待它?而我的答案总是,直接使用它。而且,你知道,当然,我觉得每个人都应该尝试一下ChatGPT,但无论是我们还是其他任何公司,都请开始使用它。因为,这是让你认识到它并非你读到的那种超级可怕事物的最佳方式。它只是帮助你完成更多事情。然后你就会觉得,哦,这太棒了。我,我现在有了这个令人难以置信的新工具,它可以成为我生活的一部分,帮助我完成任务,并帮助我自动化处理我那些枯燥的工作。所以,最重要的一点就是,开始使用它。
另外,考虑到技术改进的速度,如果你现在不开始使用它,将来就更难跟上它的步伐。如果你相信人工智能将成为我们生活的重要组成部分,那么这班列车你就不应该错过。所以,你知道,最重要的一点就是,开始使用它。
但随后,你知道,我们考虑了很多,尤其是当你涉及到代理(Agents)及其他事物时,我们非常关注确保用户处于控制之中。因此,当你在使用ChatGPT或任何其他人工智能时,你不会希望它在你不具备掌控感的情况下,擅自为你做一堆事情。所以,如果它只是为你回答一个问题,阅读一些文档并进行总结,诸如此类的事情,那是一回事。但随着我们正从ChatGPT作为一个回答问题的工具,向一个真正在现实世界中为你执行任务的产品过渡,你理应掌控它所采取的任何行动。随着时间的推移,当模型变得更好,你开始更加信任它们时,当然,你可以给予它更多的自主权,并信任它能自主地执行更多行动。但在每一步,你都应该掌控它。我认为这是我们寻求建立信任的最重要方式之一。
主持人
: 我的意思是,当你转向越来越多基于代理的工作流时,会有很多改变,模型将能够使用那些我想我们必须共同演进的工具。我认为我们绝对应该深入探讨这些问题。我只是好奇你自己的经验。我们很多人在使用大语言模型时,都会有那些令人震惊的时刻,对吧?有些非凡的事情发生了,或者你两年的心血在五秒内得到了回报。使用你自己的产品时,你最近一次感到“大受震撼”的时刻是什么?
凯文
: 嗯,那我给你讲一个,这个可能有点……务实吧,但对我来说意义重大。我们刚开始的时候,大家都在聊孩子。我们其中一个儿子做了一个小手术。而且这本来是一件所有迹象都表明不会有什么大碍的事情。但也有很小的可能性,情况会非常糟糕,你知道的。所以他们做了手术,然后取了样本去活检。然后你就在等待结果。作为父母,你会很紧张,即使你从逻辑上知道,情况不好的可能性非常小。某天,我们收到一封邮件,上面有许多看起来相当令人不安的医疗文件,说实话,上面有很多我看不懂的词。它只是在说明这是什么,但并没有告诉我是否应该为此担心。它只是作了说明,然后就结束了。我联系不上那位医生。她可能在做手术什么的。于是我当时就想:天哪,这是什么意思?于是我拍了一张照片。我把它放进了 ChatGPT。我问它:我应该担心吗?我又问它:你能给我解释一下吗?比如,我5岁。而聊天机器人做到了,它说,不,这完全没问题。一切都像没什么可担心的。而我实际上最终有72小时都没能联系上医生,因为她实在太忙了。如果我只是坐在那里闷闷不乐,那72小时对我这个家长来说会是糟糕透顶的72小时。而ChatGPT能够给出答案,这就好比,你知道,我们这些拥有优质医疗服务的人。你想想这在全世界范围内,那些没有同样医疗资源可及性的人群身上会产生多大影响。它确实非常强大。我认为这有点是ChatGPT被低估的一部分。
主持人
: 我的意思是,那确实是一个很棒的故事。很高兴你儿子健康,并从那次经历中恢复过来。嗯,但这同时也说明了这款产品的强大之处,对吧?这是一款非常复杂的产品。我不能不问你,这款复杂的产品是如何出现在ChatGPT左上角那个有趣的下拉菜单里的。你们在这方面也一定有什么高明之处。你们内部一定有个笑话,关于“我们应该怎么排列它呢?下一个叫什么呢?”那里到底发生了什么?还有,如果赶时间的话,我们是不是都应该直接用03和40呢?
凯文
: 这是一个完全合理的问题。你们也可以,你们能够,而且你们应该嘲笑我们的命名。这在某种程度上也是理所当然的。所以我们有这种迭代部署的理念,即这些模型——我认为人工智能将改变我们所有人,它将改变世界,它将改变社会。我们相信,实现这一目标的最佳方式是共同演进,是将这些模型发布出去并交到人们手中,帮助他们理解。此外,你们知道,他们也帮助我们发现模型的能力、弱点及其他方面。因此,我们得以共同学习,并能够非常快速地迭代和改进。
这就是其中一部分原因。另一部分原因在于,我们正在不断构建许多新功能。如果我们花时间只做,你知道,我们只有一个模型,而且我们必须将所有东西都构建到这一个模型中,那么我们最终的进展会慢很多。当然,那样事情会更简单。但我们最终会进展慢得多,因为有时构建一个具有特定能力集的新模型更容易,它可能擅长某些事情,但不擅长其他事情。这样一来,你就拥有了一个能做很多事情的模型集合。每个独立模型都有其优点和缺点。因此,我们基本上优化了速度,让人们能够更快地获得更多功能,但代价是会带来一些困惑。
随着时间的推移,当我们对一些新功能获得更多控制权、更好地理解它们时,我们就会将其重新整合到核心模型中。因此,你拥有像GPT-4这样能够很好地完成很多事情的模型。而且你知道,这正是我们计划在即将推出的GPT-5上所做的:吸取我们所学到的很多经验,并将更多功能整合到一个单一模型中,以便人们更容易理解和使用。这就像是,我该用哪个模型?只需使用GPT-5。而且你知道,在一个理想世界中,它会了解你所提问题的难度。因此它知道是应该给你这样一个答案,还是应该先思考一段时间。而你知道,那正是我们所追求的目标。
主持人
: 所以,在某种程度上,这正在减轻目前用户身上的认知负担,因为我会坐在那里思考,我有时间吗?这是个复杂的问题吗?它需要调用推理模型O3吗?它需要为O3提供一个稍长的提示词吗?因为如果我给它一个稍短的提示词,它可能会误解。而在某种程度上,你所说的正是将所有这些进行整合,并将其内置到模型本身中。
凯文
: 是的。瞧,我不想做的是过度承诺,然后说,哦,将来我们只会有一个模型,一切都会变得简单。因为我们,我们也是,比如说我们推出了GPT-5,在那之外我们还会有一系列新的能力,我们正在努力构建并进行实验。我们希望将这些能力提供给人们,进行迭代部署等等。所以我预计总会出现这种现象,即有新的模型出现。然后,你会有一些主力模型,同时也会有一些新的模型,它们拥有某些前沿能力,我们正在一起进行实验和学习。随着时间的推移,当这些模型成熟后,它们最终都会被整合回单一模型中。
研发揭秘:在不可预测性中构建未来
主持人
: 所以,很多速度似乎都与完成循环有关,也就是学习循环。你只需同时运行所有这些模型。这样你就能收集到足够的数据,了解哪些模型对哪些能力有效。以一种有助于你开发并实现GPT-5的方式。我希望你能和我们分享这些数据。精确到分钟。精确到分钟。是的,这样我们就能给自己计时了。但这是否也意味着,模型的各项能力还需要多久才能交付?那么,现在正在开发的一些功能,是否要到2026年年中才能融入到模型中?
凯文
: 是的,这是个好问题。在这里工作最有趣的一点就是,你对即将发生的事情会有些了解。而且,我不是研究团队的成员。所以我是在与研究人员合作的过程中了解到这些的,我想说,在产品方面,我们对未来三个月内即将推出的内容有相当清楚的了解,对未来六个月的内容可能就比较模糊了。而在那之后,就更难说了,你知道,你确实掌握了某些能力,也确实了解一点点,但你只能隐约从迷雾中看到一些未来的发展。有时候,能力是,你知道,这是研究,对吗?所以这不像你只是拥有一个公式,然后机械式地操作就行,我们正在发现新事物,而且这是不可预测的。因此有时事情会比预期耗时更长。其他时候,你会看到这些你完全没预料到的、某种程度上是涌现出来的能力,然后突然之间,某个东西就奏效了。
你能举一个刚刚就奏效了,而且你没有预料到的例子吗?嗯,我的意思是,深度研究就是一个有趣的例子,有一段时间,少数研究人员在思考,就像是,好的,我们或许可以使模型能够进行这种迭代式的研究,你知道,通过深度研究,你给模型一个任意复杂的查询,让它去研究可能需要你一周时间才能完成的事情。然后它会去进行大约100次搜索,但不是一次性全部进行,它会进行三四五次,然后对返回的结果进行推理,尝试理解它们如何与你所问的问题相关,以及还有哪些空白。然后它会去进行更多的搜索,也许会再次思考,也许在思考的同时它会编写一些代码,然后继续做更多事情,你知道的。所以这是一种迭代式的过程,我的意思是,这正是如果你被要求撰写一份非常复杂的调研报告时你会做的事情,你不会(直接写),你会先去做一些研究。
主持人
: 抱歉,凯文,我不再那样做了。我只是深入研究,而我实际上想不起自己该如何独立完成。但是的,我明白了,对吗?你必须,你得一点点摸索过去,找出探索策略,走入死胡同再折返。
凯文
: 是的。所以关于你的问题,就像那样,一些人觉得,好吧,这正在逐渐成形。但并不清楚它到底何时能完全成形。就像我们能做到的那样。因此,有一小队研究人员,他们就是相信这一点,并致力于将其变为现实。而且,你知道,有段时间,它还不够好,它还不够好。然后,你知道,有了一些进展。突然间,你会觉得,好吧,这已经足够好了。在那个时间段的某个时候,我们还安排了一个产品与工程团队与他们一起进行工作。然后你就拥有了我认为是OpenAI真正神奇的地方:当一个研究团队和一个产品与工程团队,你知道,齐聚一堂,共同发挥他们独特的技能,并且你,你理解你正在努力解决的问题。所以你会提出使用案例,并创建评估和基准,以衡量你在这些使用案例中是否成功。研究团队则采纳这些信息,并利用其改进模型本身。于是你就形成了模型朝着特定产品改进的这种紧密循环。而,你知道,我认为我们最好的产品都是通过这种方式构建的。深度研究就是一个很好的例子。
主持人
: 那相当,我的意思是,那是一种新颖的产品开发思维方式。我的意思是,如果我回顾产品开发的历史,在90年代之前,在消费互联网出现之前,产品开发常常是由工程师主导的,他们会说:“我们有了一个能做这个的新芯片。”而且你也不必费力找出能在那块芯片上发挥作用的软件。我认为消费互联网的重大突破在于将产品经理置于产品开发的核心地位。你也知道,我们讨论过精益和迭代,以及如何做到高度数据驱动和以用户为中心。而现在我们正进入一种新模式,我将其描述为绝非回归到互联网前由产品工程主导的模式,而是某种相当新颖的事物,因为研究人员发现了一种新的能力。然后你需要就这种能力如何进行产品化展开非常迅速的讨论。然后这个词用了“eval”,我猜它的意思是,如何衡量它,以判断其是否确实发挥了作用。那么,这真的是一个正在演进的新领域吗?
凯文
: 我认为这是一种完全不同的产品构建方式。它肯定与我职业生涯中做过的任何事情都不同。而且,你知道的,在研究领域内,也存在一个连续体,不是吗?我们的研究团队中有一些部分,它们就是纯粹的深度研究,性质上几乎是学术性的,因为他们只是在寻找新的突破,他们试图找出那些从未有人……你知道,从未有人解决过的问题。而对于这类事情,你不想,你知道,你根本不希望被产品驱动,因为你只想为探索和基础性突破留出大量的空间。然后是研究的另一个极端。这更多是在后期训练方面,你在那里真正尝试教导模型非常出色地完成特定任务。而这些团队往往更像是,你知道,与产品和工程团队合作,拥有共同的目标。然后介于两者之间的是一个谱系。我认为我们应采取的正确方式是,我们当然不希望完全由产品主导。这不是这个地方的魔力所在。它也许也不是完全由研究主导,因为了解你能为人们解决什么问题,以及我们如何能在世界上产生最大的影响,这些反馈是很有益的。尽管如此,它实际上是两者的结合,而研究才是真正的核心。我喜欢它,我一直都很喜欢。这是世界上最有趣的事情。而且,你知道,发展极快的计算机现在能做到两个月前还做不到的事情,我们一直处于这种状态。
主持人
: 但当你从事研究时,它不仅仅是看一个规模法则,然后说:“哦,莎拉·弗莱刚刚又批准了 10 万个 GPU。”因此,当训练运行完成时,它将在六个月内能够做到这一点。这不仅仅是这样。但我发现一个引人入胜的问题是,你如何将这些能力与产品进行匹配?你提到了“evals”,我猜是指评估。一个评估的结构是什么样的?它是否取代了我们 15 年前可能拥有的旧版产品需求文档中的内容?
凯文
: 是的,某种程度上是这样,我认为,在某些方面,它是为了理解模型在哪些方面表现出色,哪些方面不尽如人意。如果你将模型视为某种智能。智能是如此多维。人们以亿万种不同的方式展现智能。一个聪明的人在某些领域可能比另一个人更出色,而在另一些领域则可能不如人。因此,一种思考评估的方式是将其视为衡量模型在不同维度上的能力和智能的方法。所以你可以进行评估,例如衡量它在解决USAMO、奥林匹克数学竞赛式问题上的能力,以及它在化学和创意写作方面的表现。
主持人
: 那么,你们是否正在使用RKGI、Amy和GPQA这类公开基准作为衡量方式呢?
凯文
: 有些时候会用,同时在构建特定产品时,我认为最有效的产品开发方式之一是:识别你希望模型具备的、以满足产品需求的技能,并将其转化为一项评估。这样你就能真正理解你在这方面有多出色,以及如何随着时间的推移而不断进步。但一个令人着迷的现象是,我们一年前用来衡量模型的那些评估,都非常刻板和明确,例如仅针对数学进行测试。而在数学中,存在一个正确答案。不过,你可以谈谈创意写作的评估。而在创意写作中,没有答案。那么你如何评分呢?对吧?那是一个问题。另一个问题是,当你开始承担更复杂的任务时,你不仅仅是回答问题,你实际上是在尝试自动化某个多步骤工作流程,而完成这项工作的正确方式可能存在模糊性。如果我,比如我是一个AI为你预订航班,没有一个单一的方式来评判哪个航班是正确的;你会发现,我们在评估这项特定任务时,会遇到这些非常有趣、具有挑战性且主观的方式。而进行评估(如果你想至少将其自动化)的一部分是,你还需要一个评分机制,以便你能够快速了解你在该评估中的表现。所以这很有趣,我认为对于产品经理来说,随着时间的推移,一项会变得越来越重要的技能是,为自己正在构建的产品实际创建评估的能力。
主持人
: 是的,我的意思是,这是一个方面,另一方面是前端的提示词,因为我们开始从这些泄露中看到——我不知道它们是真是假——有一些X账号声称他们刚拿到泄露的系统提示,然后插入你喜欢的某个基础模型或编码工具。而系统提示词,也就是伴随每次查询发出的那种结构化指令,确实相当复杂。我的意思是,它们本身现在就是一种产品了,对吧?它们长达数千词,高度结构化,在编写时显然应用了策略。那么,当你向像我这样的人交付产品时,这种技能和能力有多重要?
凯文
: 我的意思是,实际上,比人们意识到的要重要得多,我想,我希望随着时间的推移,它变得不那么重要。而且我认为随着时间的推移确实如此,就像,如果你回溯一两年,每个人都在谈论提示词工程,它将是每个人为了利用AI做任何事情都必须掌握的技能。你现在听不到关于它的太多消息,也不再像那样被谈论得那么多了。我认为这是一件好事。你知道,理想情况下,对于任何特定的用户来说,如果他们有问题,他们希望AI能为他们做些事情,那么它就变得越来越不重要。你不应该需要深入研究诸如“我是否使用了完全正确的词?”这样的奥秘。当我给出我的指令时,你知道,它就应该能直接工作。我认为,提升智能的一部分在于模型能够理解你想要做什么,并且能很好地完成,而你无需为此付出巨大的努力。话虽如此,提示词仍然很重要。而且模型非常容易通过提示词来控制。所以你知道,我们仍然会发现,当我们推出某些东西时,它没有按照我们希望的方式在某些方面运行。很多时候,我们都可以通过提示词来调整它,而无需回去重新训练模型。所以,我希望随着时间的推移使其变得不那么必要,但它仍然是一个强大的途径。
代理的崛起:从Codex看AI如何赋能
主持人
: 嗯,这是产品发展方向的两个途径。但第三个是关于代理的理念,以及代理将为我们带来什么。我想,我用过的OpenAI推出的第一个代理产品大概是深度研究。“代理”(agent)这个词被广泛使用。我的意思是,我也会使用“代理”这个词。我的意思是,我通过你的API将一系列提示串联起来。并且有一些逻辑可以将一份文档通过一系列步骤处理到最终状态。
凯文
: 对你来说,“代理”意味着什么?我们认为代理是能够独立完成工作的实体。所以它不仅仅是快速的问答,而是真正在现实世界中为你执行任务。另一个例子,我认为深度研究就是一个很好的例子,它能够进行数百次搜索,为你整理出一份复杂的报告,而这可能要花你一周的时间。
另一个例子是Codex,这是我们刚刚推出的软件工程代理。你可以这样做,如果你有一个正在操作的代码库,你正在代码库中构建新功能或调试某些东西,你可以直接向这个代理发出提示,比如“嘿,我需要你修复这个东西”。我希望你将这个应用到我的网页背景上。我希望你,你知道的,构建这个新功能。它会去遍历你的整个代码库,理解所有的上下文。如果你,你知道的,正在修复一个错误,它会去尝试定位那个错误。然后它会为你编写新代码,并创建一个拉取请求,就像一个差异。你知道的,这是我们需要对代码进行的一系列修改。然后你就可以去审查代码了。而这个智能体完成了所有工作。
所以,你知道的,我以前是一名工程师,现在业余时间还会写一些代码,但我并没有为OpenAI写过任何一行代码。但有了Codex,我当时,这大概是在它发布前几天,我当时,你知道的,大概是晚上11点左右,正在做一大堆必须在睡觉前完成的工作。我当时想,你知道吗,我敢打赌我现在就能修复一个 bug。于是我去找了一个看起来相对简单的 bug,然后,你知道的,把上下文粘贴到 Codex 里,说,你能去修复这个 bug 吗?顺便说一下,它是一种我生平从未接触过的语言。所以如果我自己动手,会花费更多时间。10 分钟后,我提交了一个拉取请求,它看起来很合理。我提交了它,一位真正的、合法的工程师审查后说,嗯,这看起来没错。而且,你知道的,现在有几行代码今天正在发布,而这些代码就是我使用 Codex 完成的。当你可以让这个软件代理,比如说,为你实际解决现实世界的任务时,它就体现了这种东西的力量。与此同时,我还在写邮件、在 Slack 上跟进,你知道的,做我日常工作中的所有事情。所以这纯粹是额外增加的价值,我觉得这真的很棒。
主持人
: 是的,因为Codex处理过程需要一些时间,它必须阅读和理解大量材料,然后进行修改。我好奇的是,这是所有开发过代码自动化或开发者增强产品的人都会被问到的问题:那么今天,OpenAI代码库中,最初有多少部分是由Codex而非人类工程师生成的?
凯文
: 是的,这相当可观。并且正在迅速增加。
主持人
: 好的,没错。在某个有意义的范围里,我会去问O3,“有意义”在百分比上具体指什么。我会得到一个很好的分布结果。
凯文
: 酷的是,你可以同时启动10个这样的任务,对吧?所以我们实际上努力让你体验到所有这些并行处理的价值,因为,你知道,不仅仅是你只能做一件事。但是,如果你有一个Codex智能体为你工作,为什么不让10个Codex智能体为你处理10个不同的任务呢?
顺便说一句,为了将其与之前关于评测的话题联系起来,评测本身也有一个非常重要的细微之处,那就是它们必须根据你正在尝试构建的产品和你正在尝试解决的问题进行量身定制。毕竟,编程并非一概而论,它只是整个世界中一个小的垂直领域。但即便在编程领域内,你也可以擅长许多不同类型的编程。而对于 Codex 来说,这是一个很好的例子,它让我们去思考:“究竟哪些编程类型对我们来说是真正重要的?”在一个开发者所做的所有任务中,哪些类型的任务?我们真正希望擅长哪些类型的任务?于是我们为这些任务创建了评测。随后,我们在训练模型时确保进行监控,以观察它是否在这些方面变得越来越好。而且,你知道,你会去积累任务和示例供模型学习。但你这样做是针对一套特定的评测,这些评测与你想要解决的一套特定问题相对应。
主持人
: 在那方面,它非常注重能力驱动,对吧?然后它就涉及到,你如何进行充分的测试,既要确保你达到了你想要的水平,正确的得分水平,又要确保它不会脱轨,对吧?而且,我认为随着这些代理变得越来越复杂,被赋予更复杂的任务,这一点需要牢记在心。我的一个工作流程,一个非常非常简单的流程,我希望一个代理能从一系列网页中抓取数据并填充到Excel电子表格中。我当时使用的是某个第三方代理框架。
凯文
: 它非常尽职尽责,凯文,它说:“我必须检查我的工作”,结果它检查了大约400次,给我留下了75美元的账单。
主持人
: 而它第一次就已经做对了,不是吗?做对了,但却陷入了这个奇怪的循环。所以,我认为当我在和人们交流时,他们会说:“我们该如何控制这些东西呢?”这就是我听到的其中一个问题。不是从那种,你知道的,人类失控的方法或层面去衡量,而是从企业可靠性的角度。我如何才能确保这不会像魔法师的学徒那样,当我只是让它预订一个飞往意大利的航班时,它却给我预订了200个,从而失控呢?你们如何对所有这些进行测试?
凯文
: 是的,我认为这部分是为了确保,就像我们之前谈到的那样,用户在这里拥有控制权。所以你应该能够在某个时候说,嘿,你知道吗,你已经检查得够多了,这样就行了。而所有这些中另一个有趣的地方是,技术发展得如此之快,比我们习惯的技术发展速度要快得多。我们习惯于事情需要数十年才能部署并真正实现规模化。你在人工智能技术中看到的一个现象是,总会有一些基准,一些评估,人工智能就是无法攻克。人们会说,哦,人工智能就是做不到。然后有一天,有人发布了一个模型,在那个评估中得了大约5%的分数,虽然仍然基本上无法完成这项工作,但就像是开始掌握了。然后你不可避免地会发现,大约两个月后,就有一个模型在那个评估中达到了30%。然后四个月后,就出现了一个达到60的模型。然后,你们知道,在六个月内,它就完全饱和了。模型非常擅长那种新技能,并且将永远如此。所以你非常迅速地从存在性证明,转变为“哦,是的,AI模型当然能做到”。这种发展速度,我认为,仍然是我们尚未完全适应的东西。
主持人
: 就是最初的百分之一或百分之二,对吧?那部分变得困难,那部分证明了它是可以实现的。那是莱特兄弟的“飞行者”号。然后在30年内,我们就能运送大量乘客横跨大西洋了。但在这种情况下,它是在30天内完成的。
生态与未来:平台、硬件与通用人工智能
主持人
: 所以我想问一下关于编码和编码智能体的问题。那么如果你看看生成式AI应用的发展,几个星期前Similarweb发布了一些数据,你会发现,基准是通用聊天机器人每季度增长25%。那就是,你知道的,ChatGPT等。几乎所有其他产品类别,包括图像生成、视频生成、音频生成,其增长速度都慢于此,或者规模正在缩小。我认为这就像吞噬了你们核心模型能力的黑洞。根据Similarweb的数据,唯一增长更快的类别是编码,每季度增长75%。我很好奇,你们选择编码是出于商业角度吗,因为你们确实看到了需求,并且开发者总是乐于尝试?还是说你们选择编码是因为它是一组可测试、结构化、可验证的输出,比那些模糊、无定形、充斥着世界其他领域的任务要稍微容易一些?
凯文
: 是的,这是一个很好的问题。实际上,编码是一个垂直领域,它兼顾了所有这些因素。首先,你知道的,这对我们来说非常重要,因为如果我们可以加快编码速度,如果我们可以让每一位工程师更有效率,我们自己也会更有效率。因此,我们可以构建得更快,我们可以更快地将AGI(通用人工智能)带给世界。所以从这个角度来看,这很有趣。这是通往AGI本身道路上一个明确的里程碑或步骤,因为它是一种非常通用的推理。这也是一个相对容易评估的任务,就像你可以判断一样,比如在数学或其他领域,如果你得到了正确的答案。这也是我们的工程师所熟悉的。因此,这是一个他们理解并有良好直觉的问题空间。这也是一个巨大的市场,正如你所说的。这也是一个充满了早期采用者的市场。你知道的,技术人员正积极投身于此。相对而言,它也算是开放且不受监管的。这不像试图进入医疗或其他什么行业,你知道,那里有各种其他你必须做的事情。因此,所有这些有趣事物的聚合使得编程成为一个非常有趣的市场。我虽然没有看到那些数据,但我完全相信。
主持人
: 那么,在编程领域内,您是否已经看到为像您这样,技术上已不再是工程师的人提供服务的迹象了?换句话说,我们看到市场通过这些工具实现了扩张?
凯文
: 哦,是的。我认为将编程普及到全世界将会带来巨大的价值。全世界大约有 3000 万开发者,或者类似的数量,这取决于你如何定义,这很棒。那是非常多的人。但试想一下,如果十亿人都会写代码呢?我前几天和一个人聊天,他告诉我他们在新冠疫情期间。他们在当地县政府工作,试图将疫苗之类的东西分发给民众。他们当时正试图搭建一个网站进行追踪,以便人们可以注册并进行一些基本操作。而全世界都非常忙碌。他们就是做不到。他们无法创建网站,他们不具备相关的技能。结果,他们的管理效率较低,在每个人都忙得不可开交的时候,做了大量的手动工作。他当时就在说,你能想象吗,如果我当时有这些工具,我们就能在一夜之间创建一个网站,它就能直接运行了。而且,你知道,他们就能更有效地完成工作了。当你放眼全球时,你会发现这种情况出现百万次。所以我的意思是,这实际上是关于编程的另一个我觉得极其有趣的地方。这可能就是编程之所以好,因为它是一种通用技术,或许是第九个原因。如果你你能编写代码,那么你就能创造各种各样的东西。因此,十亿人能够编写代码这个想法,确实蕴含着某种强大的力量。
主持人
: 但我认为,它也表明了这可能从根本上改变软件行业,就像互联网改变软件行业一样,不仅仅是因为打包和分发,还因为我们与您的社交技术互动的方式,对吧?我的微软Word,当它还在软盘上时,从未允许我像在谷歌文档上那样与他人交换笔记。其中一个大问题是,作为一家正在构建性能最强模型的平台公司,您会为初创公司留下多少发展空间?我记得微软在Windows 95或97中引入了磁盘压缩功能,当时有大量提供磁盘压缩的第三方公司随即就倒闭了。每当你发布新的基础模型时,X上就会发生类似的事情。感觉凯文每发一条推文,就有另外 50 家初创公司倒闭。他们的空间在哪里,对吧?他们在软件世界、在 AI 软件世界中,能够免受你和其他公司正在构建的基础模型不断增强的能力威胁的空间在哪里?
凯文
: 史蒂文·辛诺夫斯基有一次给我讲了一个有趣的故事,史蒂文以前在微软负责 Windows、Office 以及所有一切业务。他当时给我讲了一个关于从 Windows 93 过渡到 Windows(或者当时它叫什么来着)再到 Windows 95,也许是 Windows 3.1 的故事,那时就像是互联网的开端。而且,当时大多数人还没有使用互联网。而且如果你想用 Windows 3.1 真正接入互联网,你得去某个,你知道,俄勒冈大学教授的网站下载一个 TCP/IP 协议栈,自己编译,然后,你知道,安装一些设备驱动程序,然后你才能真正上网。然后在 Windows 95 中,当然,互联网正在兴起。他们就说,好吧,我们需要将这些东西随 Windows 一起发布。于是他们就这么做了。就像你当时说的,有很多人会觉得,嘿,既然你已经,就像,把那个某某大学教授的工作,他做了所有这些研究,而现在你却直接发布了,真是的。史蒂芬的观点是,你绝不会想生活在一个这样的世界里:在今天,你仍然需要去某个教授的网站下载一个TCP/IP协议栈并自己编译才能让它运行起来。你只是想使用互联网。
基本上,平台的用户期望,消费者对平台的期望,是时间的递增函数。如果平台能提供更多技术,如果你看到为了构建人们真正想要构建的东西,有10家不同的公司不得不去构建完全相同的底层基础设施,那么你可能就应该直接提供那部分,这样那10家公司就可以去做更有趣的事情。我一直记得那个故事。它确实深深地影响了我。因为我认为人们将对这些平台抱有越来越高的期望,这是一个非常真实的事实。但其中的好处都归于第三方,对于这个世界中的开发者而言。因为如果平台提供更多的构建模块,那么他们就可以在这些构建模块上花更少的时间去重复造轮子,而将更多时间花在那些他们真正、独特地能增加价值的事情上。人工智能将彻底改变我们生活中的一切,你所能想象的任何行业、任何垂直领域、任何地域,人工智能都将触及。所以我认为,对于开发者而言,有巨大的机会去重塑和重新构想。我认为,我们在平台方面所能做的任何事情,通过简化更多构建模块来帮助加速这一进程,我们都应该去做。
主持人
: 那么,假设我20岁的儿子想在OpenAI的基础上构建一款产品,他去哪里构建会是好的选择呢?
凯文
: 我的意思是,几乎任何地方都可以。机遇无处不在。萨姆有一次说了这句话,它让我记忆犹新。他说,如果你正在创办一家公司,并且你正在模型能力的前沿进行构建,如果你正在构建一个勉强能用,并且你迫不及待地等待我们下一个模型的产品,因为你知道它会让你的产品大放异彩,那么你很可能就处在正确的方向上。因为你正在向世界引入新事物,你就像在让以前不可能的事情变为可能。那就是你想要达到的境界。如果你正在围绕当前模型构建某种掩盖其弱点的脚手架,并且实际上害怕我们的下一个模型,因为它可能不具备那些同样的弱点,那么这不是一个好的构建方向。因为平均而言,模型将改进得非常快。一个模型上的弱点在下一个模型上将不再是弱点。所以,我认为应该构建的,正如我们一开始谈到的,是从第一性原理重新构想用例,用AI从零开始构建它们。如果你处于一种你对下一个即将推出的模型感到兴奋的境地,因为它将使你的产品大放异彩,那是一个非常好的境地。
主持人
: 那是一个绝佳的启发式方法,实际上,如果你是一位创业者,可以思考一些当前模型尚不具备能力,但在不久的将来会具备能力的东西。你可以基于这种能力进行构建。谈到产品,就不能不提到你的新产品搭档,乔纳森·艾维。所以,请告诉我们那张可爱的黑白照片发布时,办公室里的氛围是怎样的。
凯文
: 哦,大家无比兴奋。我的意思是,你怎能不呢?比如,我整天都在使用约翰尼设计的产品。他曾参与打造我们每天使用的,一些最受珍视的产品和硬件。你怎能不想和他一起工作呢?而且你知道,通过这个过程以及其他方式认识他。他还是一个如此可爱的人。对于一个取得如此多成就的人来说。他是如此谦逊、体贴、善良、温文尔雅。然后你知道,他有时会说些什么,你会觉得,天哪,那是一种看待世界的完全不同的方式。那让我看到了我从未想过的事情。那么,这种天才与优秀品格的结合体,是不是如此呢?你怎能不为与他共事而感到兴奋呢?当然,他是英国人。
主持人
: 他将如何工作,他的团队和你的团队将如何协作?你们将如何对接?
凯文
: 嗯,我的意思是,他来主要是专注于这些消费硬件产品。并且随着时间的推移,我认为他将在OpenAI的整体设计中发挥非常重要的作用。再说一次,我对此非常兴奋。你怎能不兴奋呢?乔尼·艾维要来负责你们的许多设计,你知道吗?
主持人
: 你知道,他会在某个时候处理那个下拉菜单的问题。这就像我们得到了艾维的设计精髓一样。所以我觉得,在最后几分钟里,讨论一下硬件以及它如何与整体愿景相互作用,是很有趣的。所以,这个整体愿景,某种程度上你在开头就提到了,你谈到了人工智能系统将有点像人们在家居生活中的雇员,我想,那更像是助手,我们通常没有很多…… 我们把它看作是一个超级助手,就像一个超级助手。那么,这与需要有一个硬件设备与之配套使用之间,有什么关系呢?我本身就有一个硬件设备了。它挺不错的。
凯文
: 我现在正在和它对话。这更多的是一个机会。正如我们已经说过几次的,人工智能将触及我们生活的方方面面、日常的每一部分,以及世界的每一个角落。这意味着我认为,有机会对我们日常使用的许多服务和产品进行彻底革新和重新构想。你知道,在某些情况下,我日常使用的很多产品都非常棒。它们可能需要根本性地改变,而且它们也应该借助人工智能实现这种改变。如果它们不改变,就等于没有利用我们现有的所有这些惊人的新能力,尤其是在这些能力在12个月、24个月、36个月后将达到的水平。所以我认为这里有机会进行彻底革新和重新构想。这在软件方面和硬件方面都是如此。所以你知道,我们对此将如何发生有一些想法。显然,约翰尼对此进行了深入思考,我们也很期待看到我们能共同创造出什么。
我相信还会有许多其他人在这个领域进行开发。这也是我们为何对我们的API和开发者平台投入如此多精力和关注的原因之一。因为,你知道,世界不仅仅是OpenAI,世界上将会有很多优秀的初创公司、老牌企业以及其他所有人利用人工智能打造非常棒的产品。我们希望为其提供动力。无论如何,你知道,其中一些将是我们自己构建的第一方产品,另一些将是其他人利用我们的模型构建的产品。而且你知道,这两类事物对我们来说都非常重要。
主持人
: 我的意思是,我明白你的意思,我感同身受,因为我已经开始意识到手机作为与模型交互的形态的局限性了,你无法真正向O3输入一个较长的提示词。我非常依赖与它对话。如果我在嘈杂的地方,那样就行不通。身边环绕着环境智能的设想,我总是有一个人工智能模型在监听我的会议,并且我经常与它们对话来完成我的工作。所以你开始看到,一个拥有手机功耗、手机尺寸,并且还兼顾其他功能的东西的局限性。因此,那将是一个非常激动人心的机会。还有,请帮我报名参加内测。
在正式发布之前,我们还有几分钟时间,我想提出几个问题。中国顶尖的AI公司在核心基础模型能力方面落后多远?
凯文
: 不像以前那么落后了。我认为作为美国的AI实验室,我们必须非常清楚这一点。我认为非常重要的是,我们大家使用的那些领先模型,都应是基于民主原则而非威权主义原则构建的。我们对此非常重视。
主持人
: 市面上有没有一款不是由OpenAI构建的AI应用,无论是中国的还是其他地方的,是你非常喜欢,并且喜欢使用和把玩的?
凯文
: 我的意思是,我觉得很多视频应用都超级有趣。我也觉得Waymo很神奇。这是我用来举例说明人工智能如何影响我们生活的一个常用例子。你知道,再说一次,就像自动驾驶技术,曾有10年都像是“还有两年就实现了”。而现在突然它就在我们身边了,并且运行良好。它将改变很多。
主持人
: 这简直是魔术般的存在。你是一名狂热的跑者。我很好奇你是否拥有佳明或颂拓手表,以及你希望人工智能能为你的运动追踪器带来哪些目前还没有的功能?
凯文
: 哦,这是个好问题。实际上,我主要使用的是苹果手表。然后,如果我参加像一百英里那样的比赛,它的电池就不太够用了。所以我将使用佳明设备。我想要什么?我认为实际上我想要的一件事是更好的指导,哪怕只是一点点。而且我认为人工智能完全有能力做到这一点。我认为Strava在这一方面有一些正在研发的功能。但我很乐意看到更好、更专业的指导,比如人工智能能分析训练数据之类的,这样一来,我认为大多数用户就有可能从人工智能那里获得目前只能从专业教练那里得到的分析。我感觉这种事情,你知道的,五年后我们就会觉得,哦,天哪,我甚至无法想象它曾经不存在。但它目前才刚刚崭露头角。
主持人
: 只是一点点。但我确实明白你的意思。我认为拥有那种个性化辅导的可能性将会相当出色。那么最后一个问题,你们什么时候会交付通用人工智能(AGI)?哈哈,我们每天都在为此努力,每天都离目标更近一点。
凯文
: 我的意思是,我们什么时候会知道?我们会知道吗?我认为,你看,我认为这就像我们之前讨论过的,智能是多方面的。如今在很多领域,人工智能已经远胜于人类。而在另一些领域,人工智能却比人类差得可笑。但你知道,大约每个月或每隔一段时间,当有新模型出现时,其基础能力就会逐步提升。并且在越来越多的事情上,人工智能正变得超越人类。在某个时刻,它将在绝大多数领域都超越人类,届时我们将会那样称呼它,但这并非一蹴而就。我认为这不像我们某晚睡下时还没有通用人工智能,一觉醒来通用人工智能就出现了。这是一个人工智能在越来越多的方面变得越来越强大的渐进过程。
主持人
: 好的,带着这个想法,凯文,你继续攀登那座山吧。今天早上非常感谢您抽出宝贵时间。很高兴能邀请到您。感谢您的邀请。