商湯版ChatGPT應用平台亮相
2023-04-11 00:00
(星島日報報道)繼百度(9888)推出「文心一言」後,商湯(020)也推出了自家的類ChatGPT應用——「商量 (SenseChat)」,其為基於商湯大模型體系「日日新(SenseNova)」的中文語言大模型應用平台。而在昨日的發佈會現場,董事長兼首席執行官徐立展示「商量 」對話和超長文本的理解能力,並展示了其在編寫郵件、文本創作、中英文編程等方面的能力。此外,徐立指出公司未來會繼續深化多模態大模型體系在2B市場的應用,預期其為公司帶來的收入佔比會逐漸提升,他同時透露公司未來會開發萬億級大模型。
商湯推出的「日日新」大模型體系,可用於自然語言處理、圖片生成、自動化數據標注、自定義模型訓練等多種大模型及能力。此外商湯亦於昨日展示了基於「日日新SenseNova」大模型的中文語言大模型應用平台「商量」。「商量」有1800億參數中文大語言模型,支持例如編程助手、健康諮詢助手、PDF文件閱讀助手等創新應用。徐立在發佈會現場展示了其對多輪對話和超長文本的理解能力,以及在文本創作、編寫郵件方面的能力。
大模型體系為企業提供服務
未來開發萬億級大模型
徐立表示,Openai推出ChatGPT為AI行業帶來範式上的轉變,推動整個行業發生轉型。在此背景下商湯於2019年開始大模型的研發,他表示去年大模型業務佔公司總收入的20%,相信今年該比例會進一步提升。他強調公司的商業化變現思路清晰,將主要利用多模態大模型體系為其他企業提供服務以實現收入增長。他解釋公司的業務目前之所以主要以2B端為主,因為公司在下游市場已累計了很多服務需求,如代碼和醫療等。他又提到相比其他科技公司,公司的優勢在於能夠將多模態模型融合在一起,為客戶提供服務,如公司多模型業務包括其他同行較少涉獵的3D模型業務,而公司亦在視覺行業內有領先優勢。
此外,徐立透露,公司未來會開發萬億大模型的項目生產,但他直言目前行業裏面很多大模型,包括千億以上參數的模型,都存在數據量及算力配比不足的問題,而公司未來不會刻意追求參數的數量,而是會尋求數據和算力的精着配比,控制參數總量,提高其效能。
關鍵字
最新回應