人工智能(AI)浪潮席捲全球,科技公司爭相推出AI大模型。商湯(00020)在昨天的技術交流日上推出「日日新」(SenseNova)大模型體系,涵蓋自然語言處理(NLP)、圖片生成、自動化數據標註等多種大模型和功能。當中,商湯自研的中文語言大模型應用平台「商量」(SenseChat)正式亮相。
類ChatGPT創作文案
AI聊天機械人ChatGPT在全球爆紅,繼百度(09888)發布大語言模型「文心一言」(ERNIE Bot)應戰後,商湯類ChatGPT產品「商量」亦正式登場。「商量」為1800億參數的大語言模型,董事長兼首席執行官徐立昨天在大會上實時演示該模型系列功能,除了創作文案及故事外,還支持代碼編寫、醫療問診等應用。
徐立提到,「商量」擁有出色的多輪對話和超長文本理解能力,同時能夠大幅提升代碼編寫的效率,內部測試效率提高62%。他認為,下一代軟件開發的代碼,80%會由AI生成,人工只會佔約20%。
除了「商量」外,商湯在「日日新」大模型體系下發布系列自研生成式AI應用。其中,「秒畫」為文生圖創作平台,可根據用戶的文字要求生成不同風格的圖片。
AI數字人影片平台「如影」僅要求用戶提供5分鐘的真人影片素材,即可生成數字人分身,用戶再輸入指令即可生成不同的數字人影片。
談及「日日新」名字由來,徐立稱其來自《禮記.大學》的「苟日新,日日新,又日新」,意指大模型的迭代更新和能力日益增強。他又說,基於商湯AI大裝置SenseCore和「日日新」大模型體系,商湯會面向行業夥伴提供大模型即服務(MaaS),並透露已對外服務8家大型客戶進行大模型訓練。
擅長多模態成優勢
目前百度、阿里巴巴(09988)均已推出自家大模型,並邀請測試。隨着愈來愈多科技公司投入AI領域,徐立直言,現時對手多數強調自然語言大模型,但商湯最擅長多模態大模型,相信未來會成為公司差異化優勢。他認為,MaaS作為AI其中一個商業化方向,商湯將比同業走得更快,因互聯網公司的AI能力或優先服務自身業務場景,且有機會與客戶存在潛在競爭關係,而商湯則更為中立。
AI算力需要晶片的支持,徐立提到,美國對華高端晶片禁令可能會限制中國公司的算力提升,惟行業並非一味追求算力高速增長,數據的質素同樣重要,這為中國企業的發展「爭取了一些時間」。目前商湯SenseCore AI大裝置部署了2.7萬塊GPU,可輸出5000P的總算力,徐立透露,未來可能會再擴展1000P至2000P算力,然後會保持相若體量,「未來『GPU』可能會增加一些,迭代一些,基本上可以滿足我們對外和對內服務的需求。」
陳健婷.上海
商湯推「日日新」大模型體系 中文語言平台SenseChat登場 比併百度 - Yahoo
Read More
Tidak ada komentar:
Posting Komentar