卡帕西指出,軟件開發(fā)已經(jīng)邁入“Software 3.0”時(shí)代,這是一個(gè)由大語(yǔ)言模型引領(lǐng)的新紀(jì)元。在傳統(tǒng)的手寫代碼時(shí)代(Software 1.0)和訓(xùn)練神經(jīng)網(wǎng)絡(luò)權(quán)重時(shí)代(Software 2.0)之后,大語(yǔ)言模型通過(guò)自然語(yǔ)言直接控制計(jì)算機(jī),使得“提示詞即程序”成為新的編程范式。這一變化不僅極大地提高了編程效率,還降低了編程門檻,使得更多人能夠參與到軟件開發(fā)中來(lái)。
卡帕西強(qiáng)調(diào),大語(yǔ)言模型具有三重核心屬性:它們?nèi)缤娋W(wǎng)般的基礎(chǔ)設(shè)施服務(wù)屬性,需要百億級(jí)資本密集投入,類似于芯片晶圓廠;同時(shí),它們也擁有復(fù)雜生態(tài)構(gòu)建與分層管理的屬性,類似于操作系統(tǒng)。然而,大語(yǔ)言模型并非完美無(wú)缺,它們存在“鋸齒狀智能”的認(rèn)知缺陷,即在處理復(fù)雜任務(wù)時(shí)表現(xiàn)出色,但在基礎(chǔ)邏輯上卻容易出錯(cuò)。大語(yǔ)言模型的信息處理能力也受到上下文窗口的限制,一旦信息超出設(shè)定范圍,就無(wú)法被有效保留。
為了應(yīng)對(duì)大語(yǔ)言模型的自主性控制挑戰(zhàn),卡帕西提出了仿鋼鐵俠戰(zhàn)甲的動(dòng)態(tài)控制框架。這一框架通過(guò)自主性調(diào)節(jié)器,實(shí)現(xiàn)了類似特斯拉Autopilot的L1-L4分級(jí)決策權(quán)限分配,使得人類可以根據(jù)任務(wù)的復(fù)雜性和風(fēng)險(xiǎn)程度,動(dòng)態(tài)調(diào)整AI的自主程度,從而保持對(duì)系統(tǒng)的最終控制權(quán)。
在演講中,卡帕西還分享了大語(yǔ)言模型在軟件開發(fā)中的實(shí)際應(yīng)用案例。例如,在編程場(chǎng)景中,開發(fā)者可以直接使用ChatGPT復(fù)制粘貼代碼、提交bug報(bào)告,而無(wú)需直接與操作系統(tǒng)交互。這種部分自主化的應(yīng)用模式不僅提高了開發(fā)效率,還降低了開發(fā)難度??ㄅ廖鬟€提到了Cursor和Perplexity等成功案例,這些應(yīng)用通過(guò)整合多模型調(diào)用、提供可審計(jì)的GUI和自主滑塊設(shè)計(jì),為用戶提供了更加便捷和高效的編程體驗(yàn)。
卡帕西認(rèn)為,大語(yǔ)言模型的出現(xiàn)使得軟件變得極具可訪問(wèn)性,因?yàn)樽匀徽Z(yǔ)言編程使得每個(gè)人都能成為程序員。他舉例說(shuō),孩子們現(xiàn)在可以通過(guò)“Vibe Coding”的方式學(xué)習(xí)編程,這種基于自然語(yǔ)言交互的編程方式極大地降低了編程門檻。同時(shí),大語(yǔ)言模型也正在成為數(shù)字信息的新型主要消費(fèi)者和操控者,它們需要與我們的軟件基礎(chǔ)設(shè)施進(jìn)行交互。因此,卡帕西呼吁行業(yè)內(nèi)的開發(fā)者們積極適應(yīng)這一變化,為Agent構(gòu)建更加友好的基礎(chǔ)設(shè)施。
卡帕西的演講不僅展示了大語(yǔ)言模型在軟件開發(fā)領(lǐng)域的巨大潛力,還為我們揭示了軟件發(fā)展的未來(lái)趨勢(shì)。在這個(gè)充滿機(jī)遇和挑戰(zhàn)的時(shí)代,我們需要不斷學(xué)習(xí)和創(chuàng)新,以適應(yīng)軟件行業(yè)的快速發(fā)展和變革。