近日,在日本大阪世博會中國館內,中國經典動畫片《大鬧天宮》中的孫悟空在訊飛星火大模型的賦能下,以中、日、英三種語言與全球觀眾深度交互、談笑風生。作為大阪世博會中國館參展的唯一大模型展項,這樣妙趣橫生的現場展示,直觀揭示了中國全國產算力支撐的全棧自主可控大模型底座技術正在與千行百業深度融合、共赴未來。
大模型技術的進步,當然要靠算法算力持續迭代支撐,也需突出應用導向,在持續開拓應用場景中加速升級、在持續升級中拓展更豐富場景。進而,用更少的自主可控算力做更好的、也是更好用的人工智能模型——這也是在當下人工智能日益得到廣泛應用的大勢下提升大模型技術競爭力的可行路徑和選擇。
來自安徽的“唯一”
“俺老孫來也!”在日本大阪世博會中國館內的一塊屏幕上,手拿金箍棒的“AI孫悟空”,以上海美術電影制片廠在20世紀60年代創作的動畫片《大鬧天宮》中的高還原聲線回應現場觀眾的問候。
“可以介紹一下中國的美食嗎?”“中國有哪些美景?”“請畫一幅畫!”......面對日本觀眾拋出的一個個問題,“AI孫悟空”迅速切換日語與觀眾展開深度的交流。
在本次日本大阪世博會上,科大訊飛代表中國人工智能企業展示了領先的AI大模型技術——依托國產自主可控訊飛星火大模型,打造了支持中、日、英三種語言實時交互的人工智能大模型展項“AI孫悟空”。
值得注意的是,這是中國館唯一大模型展項。一定程度上說,科大訊飛向世界遞出一張中國人工智能的“創新名片”。
那么,“AI猴哥”是如何打造出來的?
科大訊飛對孫悟空這一經典形象進行技術化賦能與重構,通過形象建模、語音合成、唇形預測、圖像處理等AI核心技術,高度還原動畫片中孫悟空的聲音、形象,讓“AI孫悟空”每個姿態都活靈活現。
而在語音方面,在人聲鼎沸的場館內,憑借科大訊飛擁有多年智能語音技術積累和優勢,“AI孫悟空”也足夠“抗噪”,能聽清、聽懂觀眾說出的問題,生動還原孫悟空惟妙惟肖的影視角色聲線。
不僅在形象和聲音上完美復刻了大家記憶中的孫悟空,這個“猴哥”的“內核”也非常穩。在全國產算力平臺訓練的訊飛星火大模型基礎上,“AI孫悟空”的交互回答不但符合孫悟空的人設,而且擁有更機智、更全面的思維能力,能夠即時響應與觀眾幽默互動。
以中國全國產算力底座支撐的大模型技術展示經典的中國傳統文化符號,“AI孫悟空”在大阪世博會上的亮相,不僅僅是為了贏得喝彩,還是在全力展示“中國算力+中國大模型技術”所具備的廣泛行業應用落地能力。
事實上,賦能千行百業、讓各行各業先用起來的“應用為先”導向,是以科大訊飛為代表的部分中國大模型廠商一直堅持的突圍路徑。
在4月底閉幕的第三屆安徽科交會上,科大訊飛除了展示一些已為人熟知的AI+教育、AI+醫療的解決方案外,更著力展示了一些全新的落地應用場景,包括AI虛擬人交互平臺、VIAS智能座艙人機交互效果評測機器人等產品,顯示出人工智能特別是大模型技術與各行業的深度融合具備廣泛的拓展空間。
再度升級的邏輯
“能夠成為中國館唯一大模型展項,科大訊飛靠的是自主可控的AI硬實力。”科大訊飛東北亞研究院院長孫慶華表示,訊飛星火大模型基于全國產化算力底座訓練,實現全棧自主可控,具備文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態等七大核心能力,并持續迭代升級。
科大訊飛稱,目前,該公司成功應對外部環境變化,通過與華為強強聯合,合力打造我國通用人工智能新底座,讓國產大模型架構在自主創新的軟硬件基礎之上,實現了大模型核心技術底座自主可控。
今年1月,業界首個基于全國產算力平臺訓練的深度推理大模型——訊飛星火X1發布,利用更少算力實現業界一流效果。同時,訊飛星火4.0 Turbo底座升級。
4月20日,訊飛星火X1再度升級,在數學、代碼、邏輯推理等通用任務上效果顯著提升。
而這次升級,顯然受益于科大訊飛“應用為先”導向的牽引和支撐。由于融入了更多場景復雜類型數據,星火X1模型的泛化性也取得了進步。多個行業任務上展現出了業界領先的能力,在重點行業如教育、醫療、司法等領域進一步擴大了領先優勢。
此外,星火X1首發“快思考、慢思考統一模型”,由一個模型同時支持兩種思考模式,提升了模型處理不同復雜度任務的能力,滿血版星火X1僅需4張卡(華為910B)即可部署,簡化了私有化部署流程。
科大訊飛董事長劉慶峰在財報業績說明會上表示,升級后的星火X1在模型參數比業界同類模型小一個數量級的情況下,比肩國際頂尖模型水平同級別效果,再次證明基于全國產算力訓練的全棧自主可控大模型具備登頂業界最高水平的實力和持續創新的潛力。
持續的自主研發支撐
當前國內外大模型風起云涌,科技巨頭紛紛入局、各國政府高度關注、產業界積極擁抱,以大模型為代表的通用人工智能呈現出前所未有的創新活力和競爭態勢。
去年,我省發力智算建設和技術攻關,憑借智能算力躍升與場景應用創新,人工智能產業發展評價居全國第五,較2023年上升一位,在國內各省市紛紛加碼人工智能發展的大勢下,這一進位頗為不易。
而這離不開持續的自主研發支撐和人工智能應用場景的深度拓展。科大訊飛作為我省AI發展的領軍企業,其近期發布的年報也透露了這樣的信號。
去年,科大訊飛實現營業收入233.43億元,同比增長18.79%;實現歸母凈利潤5.60億元,同比下降14.78%。
科大訊飛年報揭示,其歸母凈利潤下降,主要是因為積極抓住AI的歷史新機遇,2024年在大模型研發、核心技術自主可控以及大模型應用落地等方面,新增研發投入達7.4億元。盡管這樣的研發投入影響了其利潤表現,但科大訊飛表示,這為其在通用人工智能的產業競爭中奠定了自主可控的堅實基礎和獨特優勢。
事實上,在人工智能領域,從核心技術突破到規模化產業應用是一個高門檻的過程,一方面創新團隊要能夠從單點突破進一步拓展到業務鏈條上的全棧技術,并且還能夠找到足夠大的場景,有合適的商業模式形成商業和技術的互相加強,否則只能成為單點技術提供商。
目前,科大訊飛在保持單點核心技術的創新和領先基礎上,持續在教育、醫療等國家重大民生需求,汽車、金融等國民經濟重要領域規模化應用推廣人工智能產品和方案,在認知智能方面開拓了豐富的應用場景。去年,科大訊飛大模型解決方案中標項目數達91個、中標金額達8.48億元,中標項目數及中標金額均列所有廠商榜首。
科大訊飛稱,將“持續投入星火基座大模型”。基于自主可控的大模型底座開展行業定制,在靈活性與定制深度上具有顯著優勢,既能滿足行業核心需求,又能挖掘商業價值,還可推動軟硬件一體化產品的優化升級。此外,國產自主可控市場需求日益迫切,科大訊飛全棧自主可控上的額外付出將成為先發優勢。
“隨著未來新的國產算力支撐逐步到位,科大訊飛將更有能力做業界第一梯隊的基座大模型,同時在自主可控的基礎上做行業最好的模型。”劉慶峰說。
當前,全球AI競賽正在進入“持久戰”階段。這一態勢之下,自主可控的技術能力和深度拓展的應用能力相互賦能,一定會走出一條可行且可持續的人工智能大模型躍遷之路。
責任編輯:李志慧