奥运星-汽车性能网评-提供个性化汽车资讯

首頁 > 汽車生活 > 汽車生活 > 微軟發(fā)布Phi-3 Mini:3.8B參數(shù)小到能塞進(jìn)手機(jī),性能媲美GPT-3.5

微軟發(fā)布Phi-3 Mini:3.8B參數(shù)小到能塞進(jìn)手機(jī),性能媲美GPT-3.5

發(fā)布時(shí)間:2024-04-24 22:46:37來源: 15210273549

 

編譯 | 長(zhǎng)頸鹿
編輯 | 香草

智東西4月24日?qǐng)?bào)道,4月23日,微軟在官網(wǎng)開源了小語言模型(SLM)——Phi-3-mini。這是微軟Phi-3系列模型推出的首個(gè)模型。

Phi-3-mini作為微軟Phi系列的第四代產(chǎn)品,以其38億參數(shù)和3.3T tokens的龐大訓(xùn)練數(shù)據(jù)量,在語言、推理、編碼和數(shù)學(xué)基準(zhǔn)測(cè)試中超越了眾多數(shù)百億參數(shù)規(guī)模的模型。

此外,Phi-3-mini有4k和128k tokens兩個(gè)上下文長(zhǎng)度變體,經(jīng)過預(yù)訓(xùn)練和指令調(diào)整,可以更好地理解人類的語言、表達(dá)、邏輯并執(zhí)行不同類型的指令。

與大語言模型相比,Phi-3-mini模型操作更為簡(jiǎn)便。該模型的體積很小,這一特性使其可以在端側(cè)部署和運(yùn)行。據(jù)稱,該模型可以作為聊天機(jī)器人離線訪問,且具有不亞于GPT-3.5的性能。

Phi-3-mini的成本大幅降低。微軟生成式AI研究副總裁塞巴斯蒂安·布貝克(Sébastien Bubeck)稱,相比于其他相似功能的模型,Phi-3-mini成本可能只有十分之一。

據(jù)微軟研究團(tuán)隊(duì)稱,Phi-3-mini小體積、高性能的創(chuàng)新歸功于由合成數(shù)據(jù)組成的數(shù)據(jù)集。該數(shù)據(jù)集由大量已過濾的網(wǎng)絡(luò)數(shù)據(jù)和其他AI制作的兒童讀物中的合成數(shù)據(jù)組成。

微軟計(jì)劃在未來幾周內(nèi)推出Phi-3系列的另外兩個(gè)模型,分別是Phi-3-small(7B)和Phi-3-medium(14B)。

目前有三個(gè)平臺(tái)可以獲取Phi-3-mini:

Microsoft Azure AI Studio:https://ai.azure.com/explore/models/Phi-3-mini-128k-instruct/version/2/registry/azureml

Hugging Face:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

Ollama:https://ollama.com/library/phi3

一、“小而美”的模型,Phi-3-mini優(yōu)于兩倍其尺寸模型

據(jù)微軟官網(wǎng)稱,Phi-3模型是目前能力最強(qiáng)、性價(jià)比最高的小型語言模型(SLM),其在多種語言、推理、編碼和數(shù)學(xué)基準(zhǔn)測(cè)試中均展現(xiàn)出超越同等規(guī)模甚至更大型模型的能力。

Phi-3-mini包含兩種上下文長(zhǎng)度的規(guī)模,分別是4k和128k tokens,其中128k tokens的上下文窗口支持在同類模型是首次實(shí)現(xiàn),且對(duì)模型質(zhì)量的影響微乎其微。此外,該模型經(jīng)過指令微調(diào),能夠以自然語言方式響應(yīng)和執(zhí)行多種指令,確保了其即時(shí)可用性。

Phi-3模型在小尺寸上具有突破性的性能。根據(jù)微軟研發(fā)團(tuán)隊(duì)的測(cè)試,Phi-3模型在基準(zhǔn)測(cè)試中優(yōu)于相同尺寸和更大尺寸的語言模型。其中,Phi-3-mini的性能優(yōu)于其尺寸兩倍的模型,而Phi-3-small和Phi-3-medium的性能優(yōu)于更大的模型,包括GPT-3.5 Turbo。

根據(jù)性能對(duì)照表,Phi-3-mini的兩個(gè)變體于基準(zhǔn)測(cè)試的19個(gè)對(duì)比項(xiàng)中,有17項(xiàng)勝過Gemma-7b模型,18項(xiàng)勝過Mistral-7b模型,11項(xiàng)勝過Llama-3-8B模型。但也有11項(xiàng)次于GPT3.5-Turbo模型,17項(xiàng)次于Claude-3 Sonnet模型。

 

▲Phi-3系列基準(zhǔn)測(cè)試對(duì)照表(圖源:微軟)

此外,微軟還在學(xué)術(shù)報(bào)告中稱Phi-3模型的整體性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。

Phi系列模型的起源于微軟研究部門,已經(jīng)被廣泛使用,其中Phi-2下載量超過200萬次。從用于Python編碼的Phi-1開始,到增強(qiáng)推理和理解的Phi-1.5,再到27億參數(shù)的Phi-2,Phi系列在語言理解方面超越了其25倍參數(shù)大小的模型。

微軟計(jì)劃在未來幾周內(nèi)推出Phi-3系列的另外兩個(gè)模型,分別是Phi-3-small(7B)和Phi-3-medium(14B),旨在為Azure AI和其他模型庫提供更靈活的選擇。

二、Phi-3遵循安全和高質(zhì),Phi-3-mini為多個(gè)平臺(tái)專門優(yōu)化

Phi-3模型的設(shè)計(jì)遵循了微軟的“負(fù)責(zé)任AI標(biāo)準(zhǔn)”,包括問責(zé)制、透明度、公平性、可靠性與安全性、隱私與安全和包容性。Phi-3模型經(jīng)歷了嚴(yán)格的安全度量和評(píng)估、紅隊(duì)測(cè)試、敏感用途審查,并遵循安全指南,以確保這些模型在開發(fā)、測(cè)試和部署過程中都符合微軟的標(biāo)準(zhǔn)和最佳實(shí)踐。

Phi-3模型在訓(xùn)練過程中采用了高質(zhì)量的數(shù)據(jù),這是基于先前的Phi模型工作的延續(xù)。它們還通過了廣泛的安全后訓(xùn)練,包括從人類反饋中進(jìn)行的強(qiáng)化學(xué)習(xí)(RLHF)、在數(shù)十個(gè)傷害類別上進(jìn)行的自動(dòng)測(cè)試和手動(dòng)紅隊(duì)測(cè)試。

此外,Phi-3-mini在Azure AI上配備了一套完整的部署、評(píng)估和微調(diào)工具鏈,并通過Ollama平臺(tái)使開發(fā)者能夠在本地筆記本電腦上運(yùn)行。模型還針對(duì)ONNX Runtime進(jìn)行了優(yōu)化,支持Windows DirectML,并且實(shí)現(xiàn)了跨平臺(tái)支持,包括GPU、CPU和移動(dòng)硬件。

同時(shí),Phi-3-mini也作為英偉達(dá)推理微服務(wù)(NVIDIA NIM)提供,具備可廣泛部署的標(biāo)準(zhǔn)API接口,并對(duì)英偉達(dá)GPU進(jìn)行了專門優(yōu)化。

三、Phi-3提供離線推理場(chǎng)景,AI解決方案已落地印度

微軟公司通過提供Copilots幫助客戶用生成式AI進(jìn)行業(yè)務(wù)轉(zhuǎn)型。他們認(rèn)為,不同任務(wù)對(duì)質(zhì)量成本曲線上不同規(guī)模模型的需求正日益增長(zhǎng)。

小語言模型,如Phi-3,特別適用于以下情況:資源受限的環(huán)境,包括設(shè)備上和離線推理場(chǎng)景;延遲約束的場(chǎng)景,快速響應(yīng)時(shí)間至關(guān)重要;以及成本受限的用例,特別是那些具有較簡(jiǎn)單任務(wù)的用例。

由于尺寸較小,Phi-3模型可以在計(jì)算受限的推理環(huán)境中使用,特別是Phi-3-mini可以在端側(cè)使用。Phi-3模型的較小尺寸還使得微調(diào)或定制變得更加容易和更具成本效益。此外,較低的計(jì)算需求使其成本更低,延遲更好。較長(zhǎng)的上下文窗口使其能夠處理和推理大量的文本內(nèi)容,如文檔、網(wǎng)頁、代碼等。

微軟的一些客戶已經(jīng)開始使用Phi-3構(gòu)建解決方案。比如農(nóng)業(yè)領(lǐng)域,Phi-3模型為農(nóng)民提供了更便捷、更經(jīng)濟(jì)的解決方案,并幫助他們?cè)跊]有穩(wěn)定互聯(lián)網(wǎng)連接的情況下使用AI技術(shù)。

印度一家領(lǐng)先的商業(yè)集團(tuán)ITC正在將Phi-3模型用于Krishi Mitra(一款面向農(nóng)民的應(yīng)用程序)內(nèi),幫助印度農(nóng)民通過技術(shù)手段獲得更好的農(nóng)業(yè)解決方案。據(jù)悉,該應(yīng)用已經(jīng)覆蓋了超過一百萬名農(nóng)民。

結(jié)語:大小模型相輔相成,離線AI聊天已成現(xiàn)實(shí)

微軟的Phi-3模型設(shè)計(jì)的初衷旨在兼容多種設(shè)備。Phi-3與Stability AI的Zephyr、谷歌的Gemini Nano和Anthropic的Claude 3 Haiku等小型模型一樣,能夠在端側(cè)運(yùn)行,而無需依賴互聯(lián)網(wǎng)連接。

盡管云端大模型在性能上全面超越小模型,但它們也存在一些局限性,包括較高的成本、運(yùn)行速度以及對(duì)互聯(lián)網(wǎng)連接的依賴。相比之下,Phi-3允許用戶在沒有網(wǎng)絡(luò)的情況下與虛擬助手進(jìn)行互動(dòng),能夠在不上傳數(shù)據(jù)的前提下實(shí)現(xiàn)內(nèi)容總結(jié),解決了AI領(lǐng)域的一部分弊端。

未來這類模型有望與智能手機(jī)集成,甚至可能內(nèi)置于常用家電中,為用戶的生活提供個(gè)性化建議。我們期待AI變得越來越生活化,也期待小語言模型在未來的進(jìn)步

汽車生活更多>>

2025年山東大學(xué)齊魯醫(yī)院事業(yè)編招聘啟事 2024年遵義醫(yī)科大學(xué)第二附屬醫(yī)院招聘(非編制)工作人員方案 2024年海口市美蘭區(qū)和平南街道辦事處關(guān)于擬招聘公益性崗位工作人員的公告(2人) 2024年湖北鐵道運(yùn)輸職業(yè)學(xué)院(武漢鐵路技師學(xué)院)專項(xiàng)招聘工作人員公告(4人) 2024年中國中醫(yī)科學(xué)院廣安門醫(yī)院招聘公告 價(jià)格下探至25萬元以內(nèi)?比亞迪夏前景展望 7月豪華中級(jí)車終端銷量:奔馳C級(jí)月銷13838輛領(lǐng)跑 官方一口價(jià)低至7.99萬元起 途岳新銳要和新能源搶市場(chǎng) 并入上汽大眾銷售網(wǎng)絡(luò) 斯柯達(dá)在中國還有希望嗎 10.99萬元起,全系518km續(xù)航,東風(fēng)風(fēng)神L7 EV有點(diǎn)給力! 預(yù)售11.98萬元起,最高650km續(xù)航+激光雷達(dá),AION RT來了 評(píng)凱迪拉克全新XT5:價(jià)格殺紅眼的同時(shí),還不忘“玩豪華”? 主打就是聽勸!2025款比亞迪漢全面升級(jí),僅售16.58萬元起 2024年鷹潭市月湖區(qū)部分區(qū)直事業(yè)單位選調(diào)工作人員公告 2024年撫州市資溪縣事業(yè)單位引進(jìn)高素質(zhì)人才公告 2024年南昌市第一醫(yī)院臨床護(hù)士及部分技師崗位招聘公告 2024年南昌市勞動(dòng)保障事務(wù)代理中心招聘工作人員公告 2024年吉安市青原區(qū)人民醫(yī)院(總醫(yī)院) 招聘公告 2024年南昌經(jīng)濟(jì)技術(shù)開區(qū)人民醫(yī)院耳鼻喉科醫(yī)生招聘公告 2024年江西中醫(yī)藥大學(xué)高層次人才招聘公告 2024年吉安市永豐縣某單位招聘派遣員工公告 增程車型升級(jí)智慧新藍(lán)鯨3.0,長(zhǎng)安啟源全新A07真心版將于18日上市 10月18日上市!增程/純電可選,配置升級(jí),長(zhǎng)安啟源A07真香版 車長(zhǎng)4988毫米,配2.0T+8AT,降至14.78萬,家用可以看這款B級(jí)車 配33英寸中控屏,237馬力,降至21.97萬,家用可看這款豪華B級(jí)車 奧運(yùn)選手黃雅瓊成問界新M7 Pro車主,新車究竟有何吸引力? 配置升級(jí)價(jià)格更香 2025款深藍(lán)SL03上市 售11.99-14.69萬 無懼國境線復(fù)雜路況考驗(yàn) 問界新M7國慶期間持續(xù)熱銷 奇瑞艾瑞澤8高能版新車上市 12.99萬起 新增瑪瑙紅配色 雷克薩斯 RX 銷量大跌,低至 33 萬且新增 2.0T+8AT,是否值的入?
主站蜘蛛池模板: 电磁铁_小型推拉电磁铁_电磁阀厂家-深圳市宗泰电机有限公司 | 阿米巴企业经营-阿米巴咨询管理-阿米巴企业培训-广东键锋企业管理咨询有限公司 | 河南凯邦机械制造有限公司 | 阻垢剂-反渗透缓蚀阻垢剂厂家-山东鲁东环保科技有限公司 | 「钾冰晶石」氟铝酸钾_冰晶石_氟铝酸钠「价格用途」-亚铝氟化物厂家 | ICP备案查询_APP备案查询_小程序备案查询 - 备案巴巴 | 新型游乐设备,360大摆锤游乐设备「诚信厂家」-山东方鑫游乐设备 新能源汽车电池软连接,铜铝复合膜柔性连接,电力母排-容发智能科技(无锡)有限公司 | 闭端端子|弹簧螺式接线头|防水接线头|插线式接线头|端子台|电源线扣+护线套|印刷电路板型端子台|金笔电子代理商-上海拓胜电气有限公司 | 退火炉,燃气退火炉,燃气热处理炉生产厂家-丹阳市丰泰工业炉有限公司 | 生物风-销售载体,基因,质粒,ATCC细胞,ATCC菌株等,欢迎购买-百风生物 | 模具硅橡胶,人体硅胶,移印硅胶浆厂家-宏图硅胶科技 | 高压无油空压机_无油水润滑空压机_水润滑无油螺杆空压机_无油空压机厂家-科普柯超滤(广东)节能科技有限公司 | 螺旋绞龙叶片,螺旋输送机厂家,山东螺旋输送机-淄博长江机械制造有限公司 | 家乐事净水器官网-净水器厂家「官方」 | 恒温槽_恒温水槽_恒温水浴槽-上海方瑞仪器有限公司 | 膜结构停车棚-自行车棚-膜结构汽车棚加工安装厂家幸福膜结构 | 缠绕机|缠绕膜包装机|缠绕包装机-上海晏陵智能设备有限公司 | 刹车盘机床-刹车盘生产线-龙口亨嘉智能装备 | 「安徽双凯」自动售货机-无人售货机-成人用品-自动饮料食品零食售货机 | 烟台游艇培训,威海游艇培训-烟台市邮轮游艇行业协会 | 主题班会网 - 安全教育主题班会,各类主题班会PPT模板 | 【星耀裂变】_企微SCRM_任务宝_视频号分销裂变_企业微信裂变增长_私域流量_裂变营销 | 广东恩亿梯电源有限公司【官网】_UPS不间断电源|EPS应急电源|模块化机房|电动汽车充电桩_UPS电源厂家(恩亿梯UPS电源,UPS不间断电源,不间断电源UPS) | 暴风影音| 耐腐蚀泵,耐腐蚀真空泵,玻璃钢真空泵-淄博华舜耐腐蚀真空泵有限公司 | 杭州营业执照代办-公司变更价格-许可证办理流程_杭州福道财务管理咨询有限公司 | 步入式高低温测试箱|海向仪器 | 蒸汽热收缩机_蒸汽发生器_塑封机_包膜机_封切收缩机_热收缩包装机_真空机_全自动打包机_捆扎机_封箱机-东莞市中堡智能科技有限公司 | 珠海白蚁防治_珠海灭鼠_珠海杀虫灭鼠_珠海灭蟑螂_珠海酒店消杀_珠海工厂杀虫灭鼠_立净虫控防治服务有限公司 | 壹车网 | 第一时间提供新车_资讯_报价_图片_排行! | 五轴加工中心_数控加工中心_铝型材加工中心-罗威斯 | 米顿罗计量泵(科普)——韬铭机械 | 福建珂朗雅装饰材料有限公司「官方网站」| 苏州教学设备-化工教学设备-环境工程教学模型|同科教仪 | 小程序开发公司_APP开发多少钱_软件开发定制_微信小程序制作_客户销售管理软件-济南小溪畅流网络科技有限公司 | 成都办公室装修-办公室设计-写字楼装修设计-厂房装修-四川和信建筑装饰工程有限公司 | 泵阀展|阀门展|水泵展|流体机械展 -2025上海国际泵管阀展览会flowtech china | 西安文都考研官网_西安考研辅导班_考研培训机构_西安在职考研培训 | 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 | 闪蒸干燥机-喷雾干燥机-带式干燥机-桨叶干燥机-[常州佳一干燥设备] | 合肥钣金加工-安徽激光切割加工-机箱机柜加工厂家-合肥通快 |