• <span id="n97xl"><optgroup id="n97xl"></optgroup></span>
          1. <li id="n97xl"></li>
            <label id="n97xl"><meter id="n97xl"></meter></label>

              通義千問2(Qwen2)大語言模型在PAI-QuickStart的微調(diào)、評測與部署實踐

                 2024-06-14 5414
              核心提示:里云的人工智能平臺PAI,作為一站式的機器學習和深度學習平臺,對Qwen2模型系列提供了全面的技術支持。無論是開發(fā)者還是企業(yè)客戶,都可以通過PAI-QuickStart輕松實現(xiàn)Qwen2系列模型的微調(diào)、評測和快速部署。
               Qwen2(通義千問2)是阿里云最近推出的開源大型語言模型系列,相比2月推出的Qwen1.5,Qwen2實現(xiàn)了整體性能的代際飛躍,大幅提升了代碼、數(shù)學、推理、指令遵循、多語言理解等能力。其中,Qwen2系列包含5個尺寸的預訓練和指令微調(diào)模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中,Qwen2-57B-A14B為混合專家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分組查詢注意力)機制,以便讓用戶體驗到GQA帶來的推理加速和顯存占用降低的優(yōu)勢。

              阿里云的人工智能平臺PAI,作為一站式的機器學習和深度學習平臺,對Qwen2模型系列提供了全面的技術支持。無論是開發(fā)者還是企業(yè)客戶,都可以通過PAI-QuickStart輕松實現(xiàn)Qwen2系列模型的微調(diào)、評測和快速部署。

              PAI-QuickStart 介紹

              快速開始(PAI-QuickStart)是阿里云人工智能平臺PAI的產(chǎn)品組件,它集成了國內(nèi)外 AI 開源社區(qū)中優(yōu)質的預訓練模型,涵蓋了包括大語言模型,文本生成圖片、語音識別等各個領域。通過 PAI 對于這些模型的適配,用戶可以通過零代碼和 SDK 的方式實現(xiàn)從訓練到部署再到推理的全過程,大大簡化了模型的開發(fā)流程,為開發(fā)者和企業(yè)用戶帶來了更快、更高效、更便捷的 AI 開發(fā)和應用體驗。

              運行環(huán)境要求

              •  本示例目前支持在阿里云北京、上海、深圳、杭州、烏蘭察布等多地域,使用PAI-QuickStart產(chǎn)品運行。

              •  資源配置要求:

               Qwen2-0.5B/1.5B/7B量級模型:最低使用V100/P100/T4(16GB顯存)及以上卡型運行訓練任務;

                Qwen1.5-72B量級模型:最低使用A100(80GB顯存)及以上卡型運行訓練任務。

              通過PAI-QuickStart使用模型

              開發(fā)者可以在 PAI 控制臺的“快速開始”入口,找到Qwen2系列模型,以Qwen2-7B-Instruct為例,模型卡片如下圖所示:

               


              模型部署和調(diào)用

              PAI 提供的Qwen2-7B-Instruct預置了模型的部署配置信息,用戶僅需提供推理服務的名稱以及部署配置使用的資源信息即可將模型部署到PAI-EAS推理服務平臺。當前模型需要使用公共資源組進行部署。

               

               

              部署的推理服務支持使用ChatLLM WebUI進行實時交互,示例如下:

               

               

              推理服務支持以OpenAI API兼容的方式調(diào)用,具體可見以下的Python SDK的示例。

              模型微調(diào)訓練

              PAI 為Qwen2-7B-Instruct模型配置了微調(diào)算法,支持用戶以開箱即用得方式對Qwen2-7B-Instruct進行微調(diào)。訓練算法支持使用 Json 格式輸入,每條數(shù)據(jù)由問題、答案組成,分用“instruction”、“output”字段表示,例如:

               

              77.jpg

               

              當完成數(shù)據(jù)的準備,用戶可以將數(shù)據(jù)上傳到對象存儲 OSS Bucket 中。算法需要使用V100/P00/T4(16GB顯存)的GPU資源,請確保選擇使用的資源配額內(nèi)有充足的計算資源。

               

               

              訓練算法支持的超參信息如下,用戶可以根據(jù)使用的數(shù)據(jù),計算資源等調(diào)整超參,或是使用算法默認配置的超參。

               

               

              點擊“訓練”按鈕,PAI-QuickStart 開始進行訓練,用戶可以查看訓練任務狀態(tài)和訓練日志。

               

               

              如果需要將模型部署至PAI-EAS,可以在同一頁面的模型部署卡面選擇資源組,并且點擊“部署”按鈕實現(xiàn)一鍵部署。模型調(diào)用方式和上文直接部署模型的調(diào)用方式相同。

              如果需要評測微調(diào)后模型的性能,可以從任務頁面右上角評測按鈕進入評測頁。詳情見下一節(jié):模型評測。

              模型評測

              PAI 為Qwen2-7B-Instruct模型配置了評測算法,支持用戶以開箱即用得方式對Qwen2-7B-Instruc以及微調(diào)后模型進行評測。通過評測能幫助用戶和其他模型做性能對比,更能指導用戶進行精準地模型選擇和優(yōu)化。

              模型評測入口:

              從“快速開始”頁面完成Qwen2-7B-Instruct開源模型的評測

               

               

              從訓練任務詳情頁完成微調(diào)后模型的評測

               

               

              模型評測支持自定義數(shù)據(jù)集評測和公開數(shù)據(jù)集評測:

               

               

              •  自定義數(shù)據(jù)集評測

              對于自定義數(shù)據(jù)集評測,我們使用NLP領域標準的文本匹配方式,計算模型輸出結果和真實結果的匹配度,值越大,模型越好。使用該評測方式,基于自己場景的獨特數(shù)據(jù),可以評測所選模型是否適合自己的場景。

              評測需要提供JSONL格式的評測集文件,每條數(shù)據(jù)使用question標識問題列,answer標識答案列,例如:

               

               

              符合格式要求的評測集,可自行上傳至OSS,并創(chuàng)建自定義數(shù)據(jù)集,詳情參見上傳OSS文件和創(chuàng)建及管理數(shù)據(jù)集。之后選擇評測結果輸出路徑,并根據(jù)系統(tǒng)推薦選擇相應計算資源,最后提交評測任務。等待任務完成,在任務頁面查看評測結果(模型在ROUGE和BLEU系列指標上的得分):

               

               

              •  公開數(shù)據(jù)集評測

              在公開數(shù)據(jù)集評測中,我們通過對開源的評測數(shù)據(jù)集按領域分類,對大模型進行綜合能力評估,例如數(shù)學能力、知識能力、推理能力等,值越大,模型越好。目前PAI維護了MMLU、TriviaQA、HellaSwag、GSM8K、C-eval、TruthfulQA,其他公開數(shù)據(jù)集陸續(xù)接入中。無需準備數(shù)據(jù),直接選擇PAI提供的公開數(shù)據(jù)集、評測結果輸出路徑、計算資源即可提交評測任務。等待任務完成,在任務頁面查看評測結果(模型在各個公開數(shù)據(jù)集的得分情況,其中每個公開數(shù)據(jù)集的評測范圍詳見數(shù)據(jù)集官方介紹):

               


              通過Python SDK使用

              PAI 提供了Python SDK,支持開發(fā)者方便得使用Python在PAI完成模型的開發(fā)到上線的。通過PAI Python SDK,開發(fā)者可以輕松調(diào)用PAI-快速開始提供的模型,完成相應模型的微調(diào)訓練和部署。

              部署推理服務的示例代碼如下:

               

               

              微調(diào)訓練的示例代碼如下:

               

               

              通過快速開始的模型卡片詳情頁,用戶可以通過“在DSW打開”入口,獲取一個完整的Notebooks示例,了解如何通過PAI Python SDK使用的細節(jié)。

              結論

              Qwen2(通義千問2)的推出標志著阿里云在開源大語言模型領域的最新進展。這個系列推出了不同規(guī)模的開源模型,可廣泛用于多樣化的下游應用場景。開發(fā)者可以借助PAI-QuickStart輕松地對Qwen2模型進行定制和部署。此外,PAI QuickStart還匯集了一系列先進的模型,覆蓋多個專業(yè)領域,歡迎廣大開發(fā)者們體驗和應用這些豐富的資源。

              相關資源鏈接:

              •  Qwen2介紹:

              https://qwenlm.github.io/zh/blog/qwen2/

              •  PAI 快速開始:

              https://help.aliyun.com/zh/pai/user-guide/quick-start-overview

              •  PAI Python SDK Github:

              https://github.com/aliyun/pai-python-sdk

               
              分享到: 0
              收藏 0
               
              更多>同類資訊
              免責申明
              推薦資訊
              點擊排行
              最新資訊更多>
              最新供應更多>
              網(wǎng)站首頁  |  聯(lián)系方式  |  關于我們  |  問題解析  |  版權隱私  |  使用協(xié)議  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  粵ICP備1207862號

              中國智能化網(wǎng)(zgznh®)--引領工業(yè)智能化產(chǎn)業(yè)發(fā)展 共享智能化+優(yōu)質平臺

              版權所有:深圳市智控網(wǎng)絡有限公司 學術指導:深圳市智能化學會

              粵ICP備12078626號

              深公網(wǎng)安備案證字第 4403101901094 號 | 粵公網(wǎng)安備 44030702001206號

               
              主站蜘蛛池模板: 欧美日韩国产综合视频一区二区二 | 国产亚洲精品精品国产亚洲综合| 亚洲丁香色婷婷综合欲色啪| 久久综合久久美利坚合众国| 日韩亚洲欧美久久久www综合网| 狠狠久久综合| 久久91综合国产91久久精品| 66精品综合久久久久久久| 国产成人综合亚洲亚洲国产第一页| 亚洲色欲久久久综合网东京热 | 亚洲综合久久久| 亚洲乱码中文字幕综合| 在线综合亚洲中文精品 | 2020久久精品亚洲热综合一本| 青青草原综合久久大伊人精品| 伊人色综合久久天天人守人婷| 亚洲综合婷婷久久| 激情五月综合综合久久69| 一个色综合导航| 少妇熟女久久综合网色欲| 国产成人精品综合久久久| 久久综合九色综合97_久久久| 色综合婷婷在线| 亚洲乱码中文字幕综合234| 亚洲综合精品网站在线观看| 久久综合九色综合网站| 亚洲国产精品综合久久一线| 国产人成精品综合欧美成人| 国产综合内射日韩久| 亚洲欧美日韩综合在线播放| 99久久综合狠狠综合久久| 自拍 偷拍 另类 综合图片| 亚洲综合精品网站| 伊人久久综合精品无码AV专区| 亚洲国产成人久久综合一| 亚洲狠狠综合久久| 国产欧美日韩综合精品一区二区三区| 激情综合色五月六月婷婷| 色婷婷狠狠久久综合五月| 五月天综合色激情| 国产91色综合久久免费|