長江日報大武漢客戶端5月15日訊(記者李佳 通訊員涂興佩)許多軟件已實現“以臉搜圖”功能,通過臉部識別,找到相冊里同一個人的照片,但你試過“以文搜圖”,向計算機發出文字指令找尋特定圖片嗎?計算機能“以文生視頻”,根據劇本的文字,就自動生成畫面和場景嗎?計算機能根據唐詩宋詞“以文生音”、創作出原創歌曲,讓你擁有千人千曲的“經典詠流傳”嗎?
能!在武漢,多模態大模型就能幫助人工智能像人類大腦一樣發動所有“感官”去“感受”并輸出。
近期,武漢人工智能研究院宣布,聯合中科院自動化所、華為正在打造“紫東太初”2.0全模態大模型。該大模型是在全球首個千億參數三模態大模型“紫東太初”1.0基礎上升級打造的2.0版本,未來可實現文本、圖片、音頻、視頻、3D等不同模態的統一表征和學習。這為武漢發展人工智能應用,提供了無限的想象空間。
去年,武漢獲國家支持創建“國家人工智能創新應用先導區”。今年年初,《武漢建設國家人工智能創新應用先導區實施方案(2023-2025年)(征求意見稿)中,就旗幟鮮明提出,武漢要“構筑大模型應用創新高地”,并提出“形成全球領先的跨模態理解與生成能力”。
到底啥叫“大模型”?如今大熱的ChatGPT便是建立在OpenAI的GPT-3.5系列大型語言模型之上的?;诖竽P偷腁I應用改變了用戶使用數據的方式,未來,無論企業還是個人所產生的任何數據,都可以被用來訓練大模型的產品,從而為企業帶來相關的價值。
據不完全統計,截至目前中國已有超過40家公司、機構發布了大模型產品或公布了大模型計劃。而在這些公司里,不乏百度、阿里巴巴、字節跳動、華為、小米等頭部企業,多在北京、深圳、上海、杭州等地。
武漢在這一版圖上也占有一席。2022世界人工智能大會最高獎“卓越人工智能引領者獎”獲得者、全球首個三模態大模型“紫東太初”,就是中國科學院自動化研究所和華為在漢聯合開發的,這一大模型應用了武漢人工智能計算中心的算力,并在漢孕育武漢人工智能研究院。
中科院自動化所“紫東太初”大模型研究中心常務副主任、武漢人工智能研究院院長王金橋介紹,武漢提出,基于大模型支持工業質檢、影視創作、智慧醫療、互聯網推薦、智能駕駛等場景應用,構建產業創新生態,而這正是“紫東太初”大模型擅長的。
例如在工業檢測領域,以往通過人工檢測存在主觀性,工作效率低,無法實時監測,利用AI檢測算法可增強檢測的客觀性,提高檢測效率,實時檢測促使實時糾正。在法律案件分析上,通過“紫東太初”多模態大模型,一個交通事故的案例分析,包括事件的提取、責任的判定只需要0.5秒左右,可以使相關法律案件研判的效率提升100倍左右,目前也已經應用在武漢相關法律企業。再如智慧交通領域,利用多模態感知數據以及各個路口控制的信號,可以實現路網三模態數據的優化和決策,使道路通用率提升30%,助力武漢智慧交通再升級。
王金橋介紹,產業應用層面,圍繞多模態大模型技術及應用,武智院聯合中科院自動化所打造的多模態人工智能產業聯合體已陸續吸納產學研各界近70家成員單位,共同探索通用人工智能產業化路徑。