夢想很美好。
(資料圖)
編者按:本文來自微信公眾號全天候科技(ID:iawtmt),作者:于惠如,編輯:羅麗娟 ,創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。
“認(rèn)知大模型成為通用人工智能的曙光,科大訊飛有信心實現(xiàn)‘智能涌現(xiàn)’?!?/p>
5月6日,科大訊飛星火認(rèn)知大模型揭開神秘面紗。發(fā)布會上,科大訊飛董事長劉慶峰、科大訊飛研究院院長劉聰在現(xiàn)場實測了訊飛星火在七大維度上的核心能力,包括多風(fēng)格多任務(wù)長文本生成、語言理解、泛領(lǐng)域開放式知識問答、情境式思維鏈邏輯推理、多題型可解析數(shù)學(xué)、多功能多語言代碼,以及多模態(tài)輸入和表達(dá)等。
訊飛星火認(rèn)知大模型發(fā)布的同時,科大訊飛也發(fā)布了基于該大模型的教育、辦公、汽車和數(shù)字員工等多個領(lǐng)域相關(guān)產(chǎn)品。
星火認(rèn)知大模型始于2022年12月。彼時,科大訊飛啟動“1+N”大模型技術(shù)攻關(guān),其中,“1”代表通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練方案底座平臺,“N”代表大模型在教育、辦公、汽車、人機交互等各個領(lǐng)域的落地。
“當(dāng)前,在文本生成、知識問答、數(shù)學(xué)能力三大能力上,訊飛星火認(rèn)知大模型已超ChatGPT。”劉慶峰在發(fā)布會上表示。
與此同時,劉慶峰還給出了訊飛星火的迭代時間表及每階段目標(biāo):第一階段,在6月9日,突破開放性問答,如實時問答;多輪對話能力再次升級;數(shù)學(xué)能力再上臺階。第二階段,在8月15日,突破代碼能力;多模態(tài)交互能力正式開放給客戶。 第三階段:10月24日,在通用大模型領(lǐng)域?qū)?biāo)ChatGPT,其中中文能力超越后者,英文能力與后者相當(dāng)。
此外,據(jù)劉慶峰透露,科大訊飛還將在今年推出醫(yī)療行業(yè)大模型。
發(fā)布會現(xiàn)場,劉慶峰用“最強”、“已超ChatGPT”、“遙遙領(lǐng)先”等詞形容訊飛星火認(rèn)知大模型的部分能力,但他同時也承認(rèn)訊飛星火仍然存在一些問題。比如:對新知識難以及時更新;事實類問答容易出現(xiàn)“張冠李戴”;史實、傳統(tǒng)典籍等容易“編造情節(jié)”等。
目前,星火認(rèn)知大模型已對外開放測試。
01 現(xiàn)場實測七大核心能力與百度文心一言、阿里通議千問不同,訊飛星火沒有在發(fā)布會上使用提前錄好的demo版本,而是在現(xiàn)場實測了其七大核心能力。
從現(xiàn)場演示效果來看,星火認(rèn)知大模型基本能夠流暢完成交付的各項任務(wù)。另外,訊飛星火體現(xiàn)了科大訊飛的一貫強項——語音能力,它可以通過語音轉(zhuǎn)文字進(jìn)行問答,這也是其優(yōu)勢所在。
演示中,劉聰讓星火認(rèn)知大模型寫郵件、做方案、寫新聞通稿、生成英文宣傳文案等文本生成功能,訊飛星火均流暢地完成了任務(wù)。
現(xiàn)場演示的訊飛星火的語言理解能力也在線,它理解了特定的句子和場景含義,隨著問題的變化,也調(diào)整了自己的答案
在數(shù)學(xué)能力中,除了常規(guī)計算、幾何、情景應(yīng)用等,訊飛星火解答了復(fù)雜的計算題答案。在劉慶峰看來,數(shù)理能力一定程度代表了一個大模型的聰明程度?!坝嶏w星火大模型不僅在國內(nèi)系統(tǒng)中遙遙領(lǐng)先,也超過了ChatGPT?!?/p>
此外,劉聰還展示了大模型面向泛領(lǐng)域開放式知識問答能力、邏輯推理能力與代碼能力。在多模態(tài)能力方面,星火大模型能夠根據(jù)關(guān)鍵詞句生成語音、圖片、視頻等素材,并可生成虛擬人進(jìn)行視頻展示。
不過,據(jù)官方介紹,訊飛星火的多模態(tài)能力目前還在測試中,最遲8月會提供給VIP客戶使用。
02 打通“大模型+產(chǎn)品”閉環(huán)生態(tài)訊飛星火認(rèn)知大模型發(fā)布的當(dāng)天,科大訊飛還同時發(fā)布了基于該大模型的教育、辦公、汽車和數(shù)字員工等多個領(lǐng)域相關(guān)產(chǎn)品。
以汽車為例,訊飛火星認(rèn)知大模型與智慧座艙的結(jié)合,可以實現(xiàn)車內(nèi)跨業(yè)務(wù)、跨場景人車自由交流?;诖竽P偷闹悄茏搶⒏杂?、擬人化、更懂汽車、更開放。
在學(xué)習(xí)機中,新增talktalk功能,實現(xiàn)中英文對話,存量學(xué)習(xí)機可更新迭代。辦公本和錄音筆中,新增語篇規(guī)整、要點總結(jié)、一鍵成稿,存量產(chǎn)品也可更新使用。
基于自然語言生成業(yè)務(wù)流程和RPA,在“大模型+數(shù)字員工”應(yīng)用場景,可以幫助企業(yè)員工完成大量重復(fù)性工作。
現(xiàn)場以公司招聘事項為例,輸入指令后,系統(tǒng)即可自動按照事先設(shè)計的RPA腳本,操作計算機中的相應(yīng)軟件,實現(xiàn)業(yè)務(wù)流程的自動化操作并輸出結(jié)果,并進(jìn)行數(shù)據(jù)分析。
劉慶峰透露,上述領(lǐng)域外,訊飛星火認(rèn)知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內(nèi)的更多行業(yè),滿足更多專業(yè)領(lǐng)域的需求,向更廣闊的產(chǎn)業(yè)領(lǐng)域延伸。
據(jù)了解,首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型。
03 測試體驗星火大模型“成色”究竟如何?全天候科技親測了多個場景下的問題,不妨一起來看一看它回答的如何。
我們先讓星火大模型介紹了自己和競品。
很明顯,簡單介紹沒有問題,但當(dāng)主語更復(fù)雜,需要理解時,它的理解能力“不在線”。
我們又讓訊飛星火展現(xiàn)了文字創(chuàng)作能力——根據(jù)要求寫一首詩。
這首詩基本涵蓋了端午節(jié)的要素:糯米、龍舟、艾草,還拓展了龍舟、艾草等元素的使用場景,也表達(dá)了對生活的美好祝愿。但整體而言,與其說是一首詩,它更像是一首缺少押韻、對仗、與美感的順口溜。
隨后,全天候科技針對一些時下正流行的網(wǎng)絡(luò)“熱?!边M(jìn)行提問,看其是否有緊跟熱點的能力。
然而,對于“特種兵”式旅游這個網(wǎng)絡(luò)熱梗,訊飛星火知道一點,但知道的不多。不過,它的“態(tài)度”很好,當(dāng)我們提出錯誤,它能認(rèn)識到自己的錯誤,并且道歉。
在測試過程中,全天候科技發(fā)現(xiàn),訊飛星火的部分語料庫并未更新至最新事件,對一些實事仍然給出錯誤答案。比如,當(dāng)我們問“北京冬奧會自由式滑雪女子U型場地冠軍是誰”時,它給出的答案是:法國選手特蘭斯·勒貝克 (TraceLeBerque)。不過,當(dāng)我們給出正確答案后,它又立馬承認(rèn)自己的錯誤并道歉。
在數(shù)學(xué)推理能力方面,我們請訊飛星火做了幾道數(shù)學(xué)題。對于第一個題,訊飛星火不僅給出了正確答案,還做了延伸。而對于第二個題,它給出了詳細(xì)的解題步驟及正確答案??梢钥闯觯暮唵螖?shù)學(xué)推理能力過關(guān)。
在多模態(tài)生成方面,訊飛星火的表現(xiàn)也不夠完美。
此前已經(jīng)推出的百度文心一言、阿里通義千問等大模型均具備圖片生成的能力。當(dāng)我們輸入“科大訊飛要開大模型發(fā)布會,請生成一張海報”時, 訊飛星火認(rèn)知大模型告訴我們自己無法生成圖片,但是它還是給我們提供了一些信息和建議。
除了文字,訊飛星火具備在答案中融入emoji表情包能力,當(dāng)我們讓它用emoji表情包介紹大模型發(fā)布會時,它給出了以下答案。
最后,訊飛火星究竟如何看待自己的能力?
我們拋出了劉慶峰對其已“超越ChatGPT”的夸贊,并讓它證明自己。它沒有承認(rèn),并已學(xué)會了“打太極”。


