當前位置: 華文頭條 > 推薦

全新開源AI程式碼工具誕生!超越谷歌DeepMind旗下AlphaCode

2024-02-01推薦

聽說,谷歌DeepMind開發出的 AlphaCode ,和上個月剛剛由Gemini推出的 AlphaCode 2 兩位「老大哥」 被超越了

沒錯,全新開源人工智能程式碼生成工具 AlphaCodium ,誕生了!

其開發不得不說受到了兩位老大哥的啟發,但令人驚喜的是,AlphaCodium現在已經「青出於藍勝於藍」,甚至在本周致使X(Twitter)處於混亂和激動的情緒當中。

AlphaCodium是前所未有的最好的程式碼生成方法,正如上文所說,它已經淩駕於AlphaCode和新AlphaCode2之上,且需要調整的地方少之又少。說不定它的誕生離讓AI比人類能夠生成更好的程式碼這一願望又近了一步。

OpenAI的Andrej Karpathy曾在特斯拉擔任人工智能總監,他強調了AlphaCodium在改善程式碼生成方面用到的 「 流程引擎(一種叠代式程式碼編碼法) 」的方法。

聽起來有點復雜,意思就是「從樸素提示轉變而來」,即:答案範式轉向流程範式,在這種範式中, 答案是叠代構建的

為了提高LLM在特定程式碼問題上的效能,AlphaCode的「流程引擎」重新引入了GAN架構(由Ian Goodfellow於2014年開發)的元素,包括一個生成程式碼的模型以及一個透過測試、反射和規格匹配提供程式碼完整性的對抗模型。這一操作掙脫了只使用思維鏈提示工程的局限性。

下面我們來大概看看流程圖是如何執行的。

從輸入開始,接下來再是一系列預處理步驟。AlphaCodium在這些步驟中思考問題並最終得出第一個程式碼解決方案。下一步,它會生成一些 額外的測試 來幫助完善解決方案,並最終得出實際可行的最終版本。

CodiumAI開發AlphaCodium的故事

總部位於特拉維夫的初創公司CodiumAI開發了AlphaCodium,並在CodeContests數據集上進行了測試,該數據集包含約10000個競爭性編程問題。

據該公司網站介紹,CodiumAI的使命是「 讓開發人員能夠更快地構建零錯誤程式 」。它在CodeContests基準測試中的表現也證明, 其效能將GPT-4的準確率從19%提高到44% 。根據CodiumAI的說法,這一結果不僅僅是數碼上的提高,更多是LLMs在程式碼生成方面能力的飛躍,為該領域樹立了新的標桿。

CodiumAI成立於2022年,於2023年3月籌集了1060萬美元。CodiumAI分享了AlphaCodium GitHub知識庫和一篇附帶論文【Code Generation with AlphaCodium: From Prompt Engineering to Flow Engineering】。

CodiumAI聯合創始人兼行政總裁Itamar Friedman在接受VentureBeat采訪時表示,AlphaCodium迄今為止引起的關註是出乎他意料的,但他補充說,這同樣是一個突破,可以幫助整個開發者社區——他強調 AlphaCodium不僅僅是一個模型,而是一個系統和演算法 ,可以實作程式碼生成模型和「CRITIC」模型之間的交流。

這才是最核心的創新——重要的是要把它看作一種流動和叠代,這就是為什麽我們稱之為「‘flow engineering」。這種流程使人工智能不僅可以生成樣板程式碼,還可以生成有效且準確的程式碼。

OpenAI VS 谷歌DeepMind,最大的人工智能編碼競爭

Friedman指出,他認為開發了Codex的OpenAI和開發了AlphaCode、AlphaCode 2的谷歌DeepMind是CodiumAI在編碼競爭中的強大對手,但話又說回來,最大的競爭對手還是 程式碼完整性技術本身。

Friedman認為DeepMind帶給他們很大的啟發,在他與OpenAI行政總裁Sam Altman的談話中,也提了程式碼完整性的重要性。

Friedman和Sam有非常高的一致性,他們都認為 程式碼完整性 不僅對下一代程式碼構建超級重要,而且對人工智能一致性也超級重要。AlphaCodium實際上是為了提供「下一代」程式碼的完整性。這或許會體現在,達到預想規範、獲取文化活動類文獻、達成個人信仰和其他準則。

Friedman表示,谷歌DeepMind在其AlphaGo解決方案中包括了流程引擎的一些方面,但在AlphaCode中沒有。他認為可能是因為這種想法不屬於「只是單純地需要一個更好的LLM」這一所謂主流敘事的一部份。

Friedman認為,人工智能不生成工作程式碼的原因不是因為需要更好的LLM,而是因為我們需要流量。

最後,還是希望能夠看到在不斷的更新換代中,AlphaCodium能帶給我們更多的驚喜。