说话就能编程的时代来了,AI 大神卡帕西 40 分钟演讲精华

日期:2025-06-23 13:38:49 / 人气:24


智东西 6 月 21 日消息,6 月 18 日,前 OpenAI 联合创始人、深度学习专家安德烈・卡帕西(Andrej Karpathy)在 Y Combinator(YC)于美国旧金山 Moscone 会议中心举办的 AI 创业学院(AI Startup School)活动上,发表题为《软件正在发生根本变化》的 40 分钟主题演讲,深度剖析大语言模型如何推动软件开发从传统模式迈向 “自然语言指挥 AI” 的新阶段。
一、软件进化:从代码编写到自然语言编程
卡帕西指出,软件开发已历经三个阶段。Software 1.0 是手写代码时代,开发者通过编写计算机代码实现功能;Software 2.0 则以调整神经网络权重为主,借助数据集和优化器创建参数,Hugging Face 和 Model Atlas 在这一领域发挥着类似 GitHub 的作用 。而如今,随着大语言模型崛起,Software 3.0 时代来临,“提示词即程序”,自然语言成为直接控制计算机的编程接口。例如情感分类任务,Software 1.0 需手动编写规则代码,Software 2.0 通过标注数据训练模型,Software 3.0 只需向大语言模型下达自然语言指令即可完成。并且,这种变革正在重塑开发流程,就像特斯拉 Autopilot 研发中,Software 2.0 逐步取代 1.0,如今 Software 3.0 也在吞噬整个技术栈。
二、大语言模型的三重属性与计算模式
大语言模型具有三重核心属性:一是类似电网的基础设施服务属性,如 OpenAI 等公司投入资本训练模型,通过 API 向开发者 “输送智能”,以 token 计价;二是类似芯片晶圆厂的百亿级资本密集投入属性;三是类似操作系统的复杂生态构建与分层管理属性,作为 “运行时系统” 承载提示词、工具及 Agent 等组件。在计算模式上,当前大语言模型计算类似 1960 年代的分时共享模式,多用户排队使用同一云端模型。同时,大语言模型颠覆了传统技术扩散方向,先面向个人用户,这暗示未来杀手级应用可能从个人端涌现。
三、大语言模型的优势与缺陷
大语言模型拥有强大的知识储备和记忆能力,能记住海量信息,但也存在明显缺陷。认知方面,表现出 “锯齿状智能”,处理复杂任务能力突出,却在基础逻辑如数值比较、拼写等方面频繁出错,还容易产生幻觉,缺乏完善的自我认知模型。记忆方面,受限于上下文窗口,存在 “记忆碎片” 式健忘症,信息超出窗口便无法保留。安全方面,容易遭受提示注入攻击,存在数据泄露风险。
四、应用机遇:半自动化应用与自主调节
卡帕西认为,当前最大的机遇在于开发带自主调节功能的半自动化应用。以 Cursor 和 Perplexity 为例,这类应用在保留传统手动操作界面的基础上集成大语言模型,通过定制化 GUI(图形用户界面)和 UX(用户体验)设计,优化 “生成 - 验证” 循环效率,同时设置 “自主滑块”,让用户根据任务复杂度调整 AI 的自主程度。在教育、编程等领域,这种模式能有效结合人类监督与 AI 能力,确保应用在既定规则内运行,避免 AI 失控。
五、自然语言编程与 Agent 基础设施
大语言模型以自然语言编程,降低了编程门槛,使人人都能成为开发者,“Vibe Coding” 就是典型体现。但开发应用过程中,除代码编写外,认证、支付等 DevOps 工作繁琐。因此,卡帕西提出应构建 Agent 基础设施,使大语言模型能更高效地处理数字信息。目前已有 Vercel、Stripe 等公司将文档转为大语言模型友好的 Markdown 格式,还有诸多工具帮助大语言模型适配数据,未来这一领域将持续发展,重塑软件基础设施。
卡帕西的演讲展现了大语言模型带来的技术变革与机遇。若你想深入探讨某部分内容,或了解相关技术案例,欢迎随时和我说。

作者:杏鑫娱乐




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT 杏鑫娱乐 版权所有