繼DeepSeek之后,又一國產(chǎn)模型迎來突破,或?qū)⒔獯鹗謾C(jī)端AI的疑惑互聯(lián)網(wǎng)+

湖南匯視威的視覺基座大模型V1端側(cè)版本通過實(shí)現(xiàn)輕量級(jí)的視覺文生圖手機(jī)應(yīng)用,端側(cè)AI模型可以直接在用戶的移動(dòng)端實(shí)現(xiàn)本地運(yùn)行,湖南匯視威基于國產(chǎn)算力預(yù)訓(xùn)練的視覺基座大模型V1端側(cè)版本是國內(nèi)相關(guān)領(lǐng)域的首個(gè)突破項(xiàng)目。
文 | 智能相對(duì)論
作者 | 陳泊丞
在DeepSeek爆火之后,各行各業(yè)對(duì)AI大模型的應(yīng)用與部署明顯加快。在這個(gè)過程中,端側(cè)AI模型的價(jià)值逐步被發(fā)掘,憑借低時(shí)延、實(shí)時(shí)處理、安全可靠以及成本優(yōu)化等特性備受市場(chǎng)重視,成為業(yè)內(nèi)探索AI大模型應(yīng)用的一個(gè)重要方向。
以智能手機(jī)行業(yè)為例,蘋果、小米、OPPO等終端廠商都在積極探索端側(cè)AI模型在智能終端上的部署和應(yīng)用,以提升智能終端的體驗(yàn)。但是,由于移動(dòng)設(shè)備的計(jì)算能力和存儲(chǔ)空間有限,如何在保證模型性能的同時(shí)減小模型體積,并成功部署在移動(dòng)端是一個(gè)關(guān)鍵問題。
直到今天,這一問題正在被湖南的一家科技公司破解。湖南匯視威發(fā)布基于國產(chǎn)算力預(yù)訓(xùn)練的視覺基座大模型V1端側(cè)版本,成功滿足了視覺模型在移動(dòng)端(如手機(jī)、電腦等)上的部署和推理需求,實(shí)現(xiàn)輕量級(jí)文生圖功能體驗(yàn)。
繼DeepSeek之后,又一國產(chǎn)模型迎來新突破,并很有可能在端側(cè)革新AI模型的應(yīng)用范式。這在技術(shù)層面和商業(yè)層面都有著特別的意義。
端側(cè)視覺模型照進(jìn)現(xiàn)實(shí),補(bǔ)上云端AI的短板
即使在DeepSeek火爆的基礎(chǔ)上,廠商們依然致力于探索和優(yōu)化端側(cè)AI模型的部署與應(yīng)用。通過湖南匯視威的視覺基座大模型V1端側(cè)版本可見,端側(cè)模型在實(shí)際應(yīng)用中所展現(xiàn)出來的優(yōu)勢(shì)正好彌補(bǔ)上了云端AI的短板。
一、擺脫云端算力限制,具備更低的時(shí)延和更強(qiáng)的場(chǎng)景適配性。端側(cè)AI模型可以直接在用戶的移動(dòng)端實(shí)現(xiàn)本地運(yùn)行,無須依賴云端傳輸。湖南匯視威的視覺基座大模型V1端側(cè)版本不僅能顯著降低時(shí)延,快速響應(yīng)用戶的創(chuàng)作需求,還支持離線場(chǎng)景使用,哪怕是在偏遠(yuǎn)地區(qū)或是網(wǎng)絡(luò)不穩(wěn)定場(chǎng)景也能保障體驗(yàn),讓用戶隨時(shí)隨地體驗(yàn)輕量級(jí)的視覺文生圖手機(jī)應(yīng)用。
基于本地化運(yùn)行,端側(cè)模型對(duì)比云端方案更穩(wěn)定可靠。由此,B端的企業(yè)和開發(fā)者就可以基于湖南匯視威的視覺基座大模型打造自己的專屬AI產(chǎn)品,如虛擬試衣等,不僅可以基于端側(cè)部署提供更優(yōu)質(zhì)的體驗(yàn),還能顯著降低視覺大模型邊端推理成本,從而實(shí)現(xiàn)更優(yōu)的商業(yè)回饋。
二、隱私安全保護(hù)進(jìn)階,真正實(shí)現(xiàn)“數(shù)據(jù)不出域”。基于本地化運(yùn)行模式,端側(cè)AI模型直接處理本地?cái)?shù)據(jù),避免將生成的圖片數(shù)據(jù)共享在云端,提升了用戶數(shù)據(jù)的隱私保護(hù)性,也將顯著降低數(shù)據(jù)泄漏風(fēng)險(xiǎn)。
三、推動(dòng)邊緣智能普及,加速AI普惠。湖南匯視威的視覺基座大模型V1端側(cè)版本通過實(shí)現(xiàn)輕量級(jí)的視覺文生圖手機(jī)應(yīng)用,有利于進(jìn)一步提升手機(jī)端AI的用戶滲透率和場(chǎng)景滲透率,并在企業(yè)和開發(fā)者的二次開發(fā)下讓越來越多的用戶用上安全可靠的、低成本文生圖功能。
隨著這種端側(cè)部署模式推廣開來,更多的邊緣智能如電腦、可穿戴終端等都將迎來新一輪的產(chǎn)品功能變革,釋放更多的AI紅利,讓更多的人接觸到AI,享受AI。
又一次國產(chǎn)重大突破,湖南把視覺大模型塞進(jìn)了端側(cè)
雖說端側(cè)模型方案被視為是接下來智能進(jìn)階、實(shí)現(xiàn)邊緣智能的關(guān)鍵,但是很長一段時(shí)間內(nèi),云端AI方案占據(jù)主流。究其原因,在于AI模型的端側(cè)部署考慮到模型性能、模型參數(shù)以及移動(dòng)終端的算力局限、本地存儲(chǔ)局限等一系列問題,在實(shí)際落地上存在較為嚴(yán)苛的要求。
湖南匯視威基于國產(chǎn)算力預(yù)訓(xùn)練的視覺基座大模型V1端側(cè)版本是國內(nèi)相關(guān)領(lǐng)域的首個(gè)突破項(xiàng)目,尤其是在國產(chǎn)算力和端側(cè)AI領(lǐng)域。面向特定領(lǐng)域從0到1的技術(shù)攻關(guān),背后的難度可想而知,而具體聚焦國產(chǎn)算力、模型蒸餾以及性能保障三個(gè)方面,我們或許更能體會(huì)到這一項(xiàng)目落地的嚴(yán)苛與高標(biāo)準(zhǔn)。
這或?qū)⒊蔀閲a(chǎn)端側(cè)模型進(jìn)一步擴(kuò)大發(fā)展的關(guān)鍵起點(diǎn),湖南匯視威基于國產(chǎn)算力預(yù)訓(xùn)練的視覺基座大模型V1端側(cè)版本為行業(yè)帶來了三個(gè)亮點(diǎn)。
一、國產(chǎn)路徑。本次項(xiàng)目基于中科曙光國產(chǎn)算力在4千多萬張圖片上從0到1搭建視覺基座大模型并完成預(yù)訓(xùn)練。這也就意味著,其底層計(jì)算資源已經(jīng)開始傾向于國產(chǎn)化路徑,打破了此前AI領(lǐng)域高度依賴國外算力的單一局面,不只是端側(cè)模型的部署,更為國產(chǎn)模型的發(fā)展提供了更多的可能性。
二、極限蒸餾。此前,視覺大模型多采用云端方案,能真正實(shí)現(xiàn)端側(cè)部署的在國內(nèi)還是首次。在這方面,湖南匯視威設(shè)計(jì)了跨模型結(jié)構(gòu)極限蒸餾技術(shù),將基座大模型和 8.1B大模型進(jìn)行混合蒸餾,保證在最小性能損失下,得到了0.4B的輕量化模型,讓視覺模型具備了在端側(cè)部署的可能,填補(bǔ)了國產(chǎn)端側(cè)視覺模型的技術(shù)空白。
三、性能在線。盡管是0.4B的端側(cè)模型,但是在相關(guān)的文生圖測(cè)試上依舊可以媲美8.1B的通用大模型。據(jù)了解,湖南匯視威的視覺基座大模型V1端側(cè)版本在移動(dòng)端文生圖體驗(yàn)處于國內(nèi)第一梯隊(duì),在安卓和IOS端均可以做到秒級(jí)生成一張圖片,成功突破移動(dòng)端生成高分辨力圖像的能力,生成圖像分辨率可達(dá)1024?1024。
秒級(jí)圖像生成能力意味著用戶可以在手機(jī)上直接完成高質(zhì)量圖像AI創(chuàng)作,并支持離線場(chǎng)景。這對(duì)攝影、設(shè)計(jì)、娛樂等場(chǎng)景的用戶體驗(yàn)具有革命性意義,湖南匯視威的視覺基座大模型V1端側(cè)版本通過端側(cè)部署解決隱私、延遲等問題的同時(shí),還能保障性能在線,將進(jìn)一步加速端側(cè)AI在智能終端的爆發(fā),打造全新的端側(cè)AI生態(tài)。
寫在最后
本次項(xiàng)目的突破充分證實(shí)了一點(diǎn):小模型,也有大作為;國產(chǎn)化,開拓新局面。不管是在國產(chǎn)算力層面還是在端側(cè)AI層面,湖南的這次突破作為行業(yè)標(biāo)桿將推動(dòng)更多的國產(chǎn)AI技術(shù)走向成熟,并可能催生更多的端側(cè)AI商業(yè)生態(tài)。
那么,對(duì)于用戶而言,更高效、更安全、更可靠的本地化AI體驗(yàn)即將到來,未來在更多的智能終端上,我們將可以無懼網(wǎng)絡(luò)、算力等諸多嚴(yán)苛要求一鍵開啟AI創(chuàng)作體驗(yàn)。而對(duì)于行業(yè)而言,這是國產(chǎn)化路徑和端側(cè)AI技術(shù)突破的重要里程碑,新的行業(yè)發(fā)展范式將持續(xù)革新AI產(chǎn)品形態(tài),創(chuàng)造更多的可能。
*本文圖片均來源于網(wǎng)絡(luò)
此內(nèi)容為【智能相對(duì)論】原創(chuàng),
僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
部分圖片來自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。
?AI產(chǎn)業(yè)新媒體;
?澎湃新聞科技榜單月度top5;
?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
?著有《人工智能 十萬個(gè)為什么》
?【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。