中新網北京9月16日電 (記者 孫自法)施普林格·天然旗下敞開獲取學術期刊《科學陳述》最新宣布一篇人工智能(AI)研討論文指出,世界大型言語模型(LLM)AI對話機器人在創造性思想使命上或能逾越大部分的最新智一般人類,該使命要求受試者想出日常用品的研討pg電子官方網站代替用處(發散性思想的一個比如)。不過,人工人類該研討也顯現,創造得分最高的性思人類受試者仍然能超越對話機器人的最佳答案。
該論文指出,維使發散性思想通常是命中指與創造性相關的一類思想進程,需要為特定使命想出各種不同構思或對策?;蛴獍l散性思想一般經過代替用處使命(Alternate Uses Task,部分AUT)進行點評,世界pg電子官方網站受試者被要求在短時間內想出某個日常用品的最新智其他用處,越多越好。研討受試者的人工人類答復從四個類別進行打分:流利度、靈活性、創造原創性和精密度。
論文榜首作者、芬蘭圖爾庫大學Mika Koivisto和通訊作者、挪威卑爾根大學與斯塔萬格大學 Simone Grassini兩人協作,使用人工智能大模型ChatGPT3、ChatGPT4和Copy.Ai完結繩子、盒子、鉛筆、蠟燭4個物品的AUT,并對其答案進行比較。他們經過語義間隔(答復與物品原始用處的相關度)和創造性給答復的原創性打分,并用一個計算方法在0-2的規模里量化語義間隔,一起讓不知道作答者身份的人類打分者在1-5的規模里客觀點評創造性。
該研討結果顯現,均勻而言,對話機器人的答復在語義間隔(0.95相對于0.91)和創造性(2.91相對于2.47)的得分上明顯高于人類的答復。人類答復在這兩項的得分距離更大——最低分遠低于AI的答復,但最高分遍及比AI高。最佳人類答復在8個評分項中的7項都超越了一切對話機器人的最佳答復。
論文作者總結以為,這項研討結果表明,當時AI對話機器人想構思的才能至少已與一般人類適當。他們也指出,本次研討只點評了觸及創造性點評的單項使命的體現,往后的研討或能探究如何將AI融入創造性進程來提高人類體現。(完)。