Inflection指出,在MMLU、GPQA Dimond、Big-Bench-Hard、Mathematics等基準評測上,新一代Inflection-2.5模型表現都接近GPT-4。(圖片來源/Inflection)

於2022年創立的AI公司Inflection周四(3/6)發表了新一代的大型語言模型Inflection-2.5,指出在許多的基準測試中,該模型已可比美OpenAI的GPT-4及Google Gemini,此外,Inflection-2.5也已被部署在Pi聊天機器人中。

Inflection執行長暨共同創辦人的Mustafa Suleyman為AI領域的研究先驅,他在2010年即共同創辦了DeepMind,在Google於2014年買下DeepMind之後,亦轉至Google負責DeepMind。Inflection另一名創辦人則是科技產業的創業家Reid Hoffman,曾共同創辦已被微軟收購的LinkedIn。

現階段Inflection的主要產品為去年5月發表的Pi聊天機器人,Pi定位為個人AI,可充當使用者的教練、知己、創意合作夥伴或是傾訴的對象,Pi具備高情商,強調友善、支持、好奇、謙虛 、創意及有趣,已支援桌面、瀏覽器、Android及iOS等平臺,也可直接將它嵌入WhatsApp、Instagram與Facebook中,但目前僅有英文、西班牙文、法文、德文、義大利文及葡萄牙文,尚未提供中文服務。

新的Inflection-2.5模型不管是在MMLU、GPQA Dimond、Big-Bench-Hard、Mathematics、Coding或Common Sense等基準評測上都接近GPT-4模型。平均而言,在各種IQ導向的AI任務中,Inflection-2.5的平均表現已達到GPT-4的94%,但進行訓練所使用的運算量,卻只有GPT-4的40%。

Suleyman表示,現在Inflection將把IQ加入Pi卓越的EQ中。

Pi聊天機器人現在每天已有100萬活躍用戶,每月活躍用戶則是600萬,自去年5月以來,使用者與Pi交換的訊息已超過40億則。根據Inflection的統計,使用者每天與Pi的對話平均持續33分鐘,更有1/10的對話超過1小時,每一周與Pi交談的使用者中,有60%會在隔周重返Pi,其每月的使用者黏性高過競爭對手。

熱門新聞

Advertisement