Meta利用之前所發布的可商用大型語言模型Llama 2做為基礎,推出程式開發用的語言模型Code Llama。Code Llama總共有三種變體,第一種是基礎程式碼模型,第二種是針對Python微調的模型,第三種則是針對自然語言指令進行微調的模型變體。與Llama 2相同,Code Llama也是可免費用於研究和商業用途。
Code Llama使用更多程式碼資料集訓練,並且從該資料集擷取更多資料,進行長時間的訓練而成,是專門處理程式碼的Llama 2模型。因此Code Llama具有更強的程式碼編寫能力,可以根據程式以及自然語言提示,生成程式碼或是有關程式碼的自然語言回應,執行程式碼完成和除錯任務,支援的程式語言包括Python、C++、Java、PHP、Typescript、C#和Bash。
根據不同服務和延遲需求,Meta推出三種大小的Code Llama模型,分別具有70億、130億和340億參數,70億參數的版本可以在單個GPU上運作,最大的340億模型則能夠回傳最佳結果,因此用戶可以依據需求選用不同大小的模型,針對需要諸如即時程式碼完成這類低延遲任務,選用70億、130億參數的模型更為適合。
這三種大小的模型,皆經過5,000億程式碼和相關內容的Token訓練,官方提到,70億、130億基礎模型和指令模型具有FIM(Fill-In-The-Middle)能力,因此能夠生成可插入至現有程式碼中的程式碼。
FIM使模型能夠在現有的文字和程式碼中插入和填充內容,類似程式開發環境中程式碼自動完成,或是程式碼建議功能。而70億、130億基礎模型和指令模型具有FIM功能,也就是說使用者不需要額外訓練或是調整,就可以直接使用該功能。
Code Llama具有處理長序列內容的能力,能夠穩定生成10萬Token的內容,並且也能夠處理高達10萬Token的輸入。處理長輸入序列的Code Llama能夠支援更多的使用情境,像是使用者可以提供更多來自程式碼庫的上下文,並且對更大的程式碼庫進行除錯。
由於Python是經過許多程式碼生成基準測試的語言,而且Python也在人工智慧社群扮演重要角色,因此Meta針對Python,額外以1,000億Python程式碼Token進行微調,生成Python程式開發專用的Code Llama - Python模型。另外,Code Llama - Instruct則是針對指令進行微調的模型版本,能夠處理自然語言指令輸入和輸出,更好地理解使用者所給出的指令。
Meta使用目前兩種流行的程式開發基準來測試Code Llama模型,分別是HumanEval與MBPP(Mostly Basic Python Programming),HumanEval可以測試模型根據文件字串完成程式碼的能力,而MBPP則可以測試模型根據描述編寫程式碼的能力。
經測試,Code Llama程式開發的能力優於其他開源,且同樣針對程式碼生成的大型語言模型,Code Llama 340億參數模型版本,在HumanEval得分53.7%,而在MBPP的得分則是56.2%,較其他開源解決方案更高。
熱門新聞
2025-01-10
2025-01-10
2025-01-10
2025-01-10
2025-01-10
2025-01-10